# (19)日本国特許庁 (JP) (12) 公開特許公報(A)

(11)特許出購公開番号

特開平7-271738

(43) 公開日 平成7年(1995)10月20日

(51) Int.Cl.<sup>6</sup>

織別記号 庁内整理番号

FΙ

技術表示簡所

G06F 15/16 9/46

430 C 350 7737-5B

審査請求 有 請求項の数20 OL (全 30 頁)

(21) 出願番号

特爾平7-41126

(22) (H)(0) FI

平成7年(1995)2月28日

(31)優先権主张番号 08/221026

(32) 優先日 (33)優先権主張国

1994年3月31日 米隊 (US)

(71) 出額人 000004237 日本質領株式会社

東京都港区芝五丁目7番1号

(72)発明者 スレッシュ ジャガナサン

アメリカ合衆国、95134 カリフォルニア、 サン ジョーズ リオ ロブルス 110

エヌ イー シー アメリカ、インコーボ

レイテッド内

(72)発明者 ジェームス エフ. フィルビン

アメリカ合衆国、95134 カリフォルニア、

サン ジョーズ, リオ ロブルス 110 エヌ イー シー アメリカ、インコーポ

レイテッド内 (74)代理人 弁理士 後藤 洋介 (外2名)

(54)【発明の名称】 ソフトウエア・アーキテクチャを用いた高度並列コンピュータ・システムの制御方式

## (57)【要約】

【目的】 いくつかの抽象体の層を備えた、高度並列コ ンピュータ・システムを制御するソフトウエア・アーキ テクチャを用いた制御方式の提供。

【構成】 抽象物理的マシン10 (第1層) は抽象物理 的プロセッサの組を含んでおり、マイクロカーネルと者 えることができる。第2層は仮想マシン2と仮想プロセ ッサ16とを含んでいる。仮想マシンは仮想アドレス空 間と、仮想トポロジーで接続された仮想プロセッサの組 とを備えている。仮想マシンは抽象物理的マシンにマッ ビングされ、各仮想プロセッサは抽象物理的プロセッサ にマッピングされている。第3層は、スレッド18を定 義している。スレッドは、仮想プロセッサ上でランする ライトウエイトのプロセスである。望ましくは、抽象物 理的マシン、抽象物理的プロセッサ、仮想マシン、仮想 プロセッサ、スレッド・グループ、ならびにスレッドは すべてファーアストクラスのオブジェクトである。



## 【特許請求の範囲】

【請求項1】 高度並列コンピュータ・システムを制御 するためのソフトウエア・アーキテクチャを用いた高度 並列コンピュータ・システムの制御方式において、

一つのマイクロカーネルを形成する複数の抽象物理的フ ロセッサを備えた複数の抽象物理的マシンと;前記複数 の抽象物理的プロセッサに付随し、複数の仮想プロセッ サを備えた複数の仮想マシンと;前記複数の仮想プロセ ッサ上でランする複数のスレッドを備えた複数のスレッ ド・グループトを備え

前記複数の仮想プロセッサおよび前記複数のスレッドは ファーストクラスのオブジェクトであることを特徴とす るソフトウエア・アーキテクチャを用いた高度並列コン ビュータ・システムの制御方式。

[請求項2] 前記複数の仮想プロセッサは仮想トポロ ジーにおいて接続されていることを特徴とする請求項1 記載のソフトウエア・アーキテクチャを用いた高度並列 コンピュータ・システムの制御方式。

【請求項3】 前記マイクロカーネルのポリシーを管理 するマイクロカーネル・ポリシー・マネージャはユーザ がカスタマイズできることを特徴とする請求項1記載の ソフトウエア・アーキテクチャを用いた高度並列コンピ ュータ・システムの制御方式。

(請求項4) 前記複数の仮規プロセッサは、前記複数 のスレッドのポリシーを管理する複数のスレッド、ポリシー・マネージャのうち、ユーザが、どのストッド・ポ リシー・マネージャをカスタマイズできるかを含むこと を特徴とする請求項1記載のソフトウエア・アーキテク チャを用いた高度並列コンピュータ・システムの制御方 式。

(請求項5) 前記複数のスレッド、前記複数の仮想プ ロセッサ、ならびに前記複数の抽象物理のプロセッサ は、機能的に連携し、仮想トポロジーを構取することを 特徴とする請求項1記載のソフトウエア・アーキテクチ ャを用いた高度並列コンピュータ・システムの制御方 式。

【請求項6】 前記仮想トポロジーはユーザがカスタマ イズできることを特徴とする請求項5記載のソフトウエ ア・アーキテクチャを用いた高度並列コンピュータ・シ ステムの制御方式。

【請求項7】 前記複数のスレッドは、それらのそれぞれの実行コンテクストから分離でき、実行コンテクストの遅延された割り当てを許すことを特徴とする請求項1 記載のソフトウエア・アーキテクチャを用いた高度並列コンビュータ・システムの制御方式。

[請求項8] 複数の多様な形態のポートをさらに備え たことを特徴とする請求項 記載のソフトウエア・アー キテクチャを用いた高度並列コンピュータ・システムの 制御方式。

【請求項9】 前記複数の多様な形態のポートはそれぞ

れファーストクラスのオブジェクトであることを特徴と する請求項8記載のソフトウエア・アーキテクチャを用 いた高度並列コンピュータ・システムの制御方式。

[請求項 10] 前記複数のスレッドは、一般データと 複合データとを含むメッセージを送ることを特徴とする 請求項 8記載のソフトウエア・アーキテクチャを用いた 高度並列コンピュータ・システムの制御方式。

[請求項11] 前記複数のスレッドは、それらのそれ ぞれのローカル・スタックおよびヒーブを、他の複数の スレッドとは独立に、ガーペッジ・コレクトすることを 特徴とする請求項1記載のソフトウエア・アーキテクチ ャを用いた高度並列コンピュータ・システムの制御方 ポ

【請求項12】 前記複数のスレッド・グループはそれ らのそれぞれの共有ヒーブを、無関係の複数のスレッド ・グループとは独立に、集めるこを特徴とする請求項 1記載のソフトウエア・アーキテクチャを用いた高度並 列コンビュータ・システムの制御方式。

【請求項13】 前記複数の仮想プロセッサは前記複数 の抽象物理的プロセッサ上に多重化されていることを特 後とする請求項1記載のソフトウエア・アーキテクチャ を用いた高度並列コンピュータ・システムの制御方式。

【請求項14】 前記複数の仮想プロセッサ、前記複数 の仮想マシン、ならびに前記複数のスレッドは、持続性 メモリ内に存在することを特徴とする請求項1記載のソ フトウエア・アーキテクチャを用いた高度並列コンピュ ータ・システムの制御方式。

【請求項15】 前記複数の抽象物理的プロセッサはファーストクラスのオブジェクトであることを特徴とする 請求項1記載のソフトウエア・アーキテクチャを用いた 高度並列コンピュータ・システムの制御方式。

【請求項16】 前記複数の仮想マシンはファーストク ラスのオブジェクトであることを特徴とする請求項15 記載のソフトウエア・アーキテクチャを用いた高度並列 コンピュータ・システムの制御方式。

【請求項17】 前記複数の抽象物理的マシンおよび前 記複数のスレッド・グループはファーストクラスのオブ ジェクトであることを特徴とする請求項16記載のソフ トウエア・アーキテクチャを用いた高度並列コンピュー タ・システムの制御方式。

[請求項 18] 各々が仮想プロセッサ・コントローラ と仮想プロセッサ・ポリシー・マネージャとを有し、物 理的トポロシーにおいて装飾された複数の抽象物理的プ ロセッサと:各々が、仮想アドレス空間と複数の仮想プ ロセッサとを有する複数の仮想マシンと:を備えたコン ピュータ・システムであって、

前記複数の仮想マシンの各々の前記複数の仮想プロセッサは、前記仮想プロセッサ・コントローラ及び前記仮想 プロセッサ・ポリシー・マネージャに応答して実行し、 かつ、スレッド・コントローラとスレッド・ポリシー・ マネージャとを有し、前記複数の仮想プロセッサは仮想 トポロジーにおいて接続され、各仮想プロセッサはそれ ぞれの抽象物理的プロセッサにマッピングされており、 前記コンピュータ・システムは、前記スレッド・コント ローラと前記スレッド・ポンシー・マネージとに応答 する前記複数の仮想プロセッサ上でランする複数のスレ ッドを、更に、備えていることを特徴とするコンピュー タ・システム。

【請求項19】 前記複数の仮想プロセッサは前記複数 の抽象物理的プロセッサ上で多重化されていることを特 徴とする請求項18記載のコンピュータ・システム。

【請求項20】 更に、持続性メモリを備え、この持続 性メモリには、前記複数のスレッド、前記複数の仮想プ ロセッサ、ならびに前記複数の仮想マシンを含むオブジ ェクトが存在することを特徴とする請求項18記載のコ ンピュータ・システム。

## 【発明の詳細な説明】

## [0001]

【0002】にのコンピュータ・ソフトウエア・アーキ ナクチャを用いた制御方式は、制御の問題をポリシーの 問題から分離したオペレーティング・システムにもとづ いている。この分離はシステムの2つの異なる抽象体レ ベルで行っている。すなわち抽象物理的ブロセッサと仮 出ブロセッサとにおいてである。これら抽象体のそれぞ れは2つの構成要素に分れている。1つは、抽象体の制 郷部分を実現する"コントローラ"であり、もう1つは コントローラに対してボリシーを決定する"ボリシー・マネージャ"である。制御をボリシーを分離すること によって、機能的に同一のシステムに対する異なる振舞 の定義を、抽象体のポリシー・マネージャ部分を変更す るのみで行うことが可能となる。

【0003】具体的には、このソフトウエア・アーキテ クチャを用いた制御方式は、制御のライトウエイト・ス レッドと仮想プロセッサとをファーストクラスのオブジ ェクトとしてサポートする。並行(コンカレンシー)マ ネジメントは、ファーストクラスのプロシージャおよび ファーストクラスのコンティニュエーションによって実 現する。それによって、ユーザが基本的なランタイム・ システムに関する知識を持っていなくても、アプリケー ションのランタイムの振舞を最適化することが可能とな る。

【0004】さらに具体的には、本発明は、非問期並行

構造の構築と、基本的制御メカニズムとしてコンティニュエーションを用いてスレッド・コントローラの実現と、大規模並行計算の組織化と、並列計算のための強固なプログラミング環境との設計に関するものである。 【0005】

【従来の技術】並列計算に対する興味が高まり、その結果、並行性を表現するために高レベルのブログラン人言語・今数、生み出された。非数値的アプリケーション領域をターゲットにする並列言語は典型的に、動的なライトウェイト・プロセスの生成、高レベル同期基本命令、分数データ構造、ならびにスペキュラティブな並行性を実現する並行構造をサポートする(効率は異なっている)。これらの並列言語は事実上すべて、2つの部分言語から成ると考えられる。2つの部分言語とは、すなわち、プロセスの集まりのアクティビディを管理し同期化する調整言語と、与えられたプロセスに限定されるデータ・オブジェクトを扱う計算言語とである。

【0061 伝統的に、オペレーティング・システムにはいくつかのクラスがある。例えば、リアルタイム、ソタラクティブ(会話型)、バッチなどである。これら3つのクラスのオペレーティング・システムはユーザに対して異なるインターフェースを提供するので、プログラムをあるクラスのオペレーティング・システムに移動するのは困難であった。さらに、各クラスのオペレーティング・システムが決定するスケジューリングは異なっているので、1つのオペレーティング・システムが決定するスケジューリングは異なっているので、1つのオペレーティング・システムのオペレーティング・システムのア・ジャンテンジ・とのアログラング・システムのでは、例えばリアレクションがターゲット・システムとで選出しく、またアプリケーションがターゲット・メステムとで運搬しく、またアプリケーションがターゲット・メステムとで運搬しく、またアプリケーションがターゲット・メステムとで運搬しく。またアプリケーションがターゲット・メステムとでは関して自信を持つことは国難であった。

[0007] そして、これらのクラスのシステムではそれぞれ異なるスケジューリング方式を用いているので状況はさらに複雑である。例えば、ある種のリアルタイム・システムでは、複数のプロセスに対してスケジューリングの側呼は固定しているのに対して、別のシステムでは、機能規律を用いたり、ランニング・クオンタムを用い、さらに他のシステムでは、それらを組み合せている。会話型オペレーティング・システムあるいはバッチ・オペレーティング・システムはスケジューリングに関してかなりの数の選択肢を有している。

[0008]制御をポリシーから分離することによって、種々のクラスのオペレーティング・システムに対して容易にカスタマイズできるオペレーティング・システムを構築できる。本発明では、ボリシー・マネージャを実現するモジュールは典型的にはシステムのサイズに比べて非常にから、一般にコードのライン数は100未

湯である。従って、ボリシーの振舞が異なるシステムを 新たに構築する場合、通常はコードの小部分を書くのみ でよい。また、ボリシー・マネージャは良く 定義された インターフェースを提供するので、ボリシーの振舞を変 更した場合。システム全体を記録する必要はなく、新し 、ボリシー・ステム全体を記録する必要はなく、新し 、ボリシー・ステムをよび終する必要はなく、新し 、ボリシー・ステムをとなるがあるが異なる。

【0009】 Hydra (参考文献: "HYDRA/ C. mmpi: An Experimental Co mputer System", William W ulf, Roy Lexia, 及びSamuel Ha rbison著, McGraw-Hill, 1991) は、制御とポリシーとの分離を意図して設計された最初 のオペレーティング・システムである。しかし、Hvd raはボリシーのカスタマイズをカーネルのレベルでし か認めていない。本発明ではさらに進めて、ポリシーの 決定を、それらが特定のプログラムに関連するものであ る場合、カスタマイズできるようにする。従って、エデ ィタやウインドウ・マネージャなどの会話型プログラム は、流体力学のシミュレーションや有限要素法の計算な ど、計算を主体とするプログラムとは非常に異なったポ リシーを持つことができる。また、Hydraにおける 制御とポリシーとの分離はコストのかかるものとなって いる。それは、カーネルとポリシー・マネージャとの間 に複数のコンテクスト・スイッチを必要とするからであ る。本発明では、ポリシー・マネージャは一般に適当な アドレス空間に直接リンクしており、コンテクストの切 り換えは不要である。従って本発明のポリシー・マネー ジャは少なくとも従来のオペレーティング・システムに おけるポリシー・マネジメント(カスタマイズできた い)と同程度に効率的であり、そして通常は従来以上に 効率が良い。

【0010】高レベルの並列言語を実現する1つの方法 は、専用の(ユーザ・レベル)仮想マシンを構築するこ とである。仮想マシンは基本的に、調整部分言語に見ら れる高レベルの並行プリミティブを実現するサブストレ ートとして機能する。調整賞語しが並行プリミティブP をサポートする場合、Lの仮想マシン(LP)の役割 は、Pの実現に関連したことをすべて扱うことである。 そのためにはマシンが、プロセスのスケジューリング、 記憶、管理、同期化、その他を管理することがしばしば 必要となる。しかし、LpはPを効率良く実現するよう にのみ調整されているので、非常に異なった並行プリミ ティブを実現することは多くの場合適当でない。従っ て、並行ブリミティブP'によってLの方営を構築する ためには通常、仮想マシンを新たに構築するか、あるい はPを用いてP'の意味規制を表現する必要がある。こ れら2つのアプローチには明らかに欠点がある。すなわ ち、第1のアプローチでは複雑な仮想マシンを新たに構 築するため、コスト高である。一方、第2のアプローチ は、Pの意味規制が高レベルであり、またLp の機能が 限定されているので、不十分である。

【0011】 言語の実現において、並行性を実現するた めに専用の仮想マシンを構築する代りに、低レベルのオ ペレーティング・システムの機能を用いることができ る。プロセスの生成およびスケジューリングは、OSが 管理する、制御のスレッド(ヘビーウエイトあるいはラ イトウエイト)によって実現する。そして同期化は、低 レベルの、OSが管理する構造体を用いて扱う。このよ うにして実現したものは一般に、専用の実行時システム の周辺に構築したシステムより、ポータブルであり、ま た拡張性が高い。ただし、カーネル(低レベル)はすべ て、アプリケーションとオペレーティング・システムと の間の保護境界を横断する必要があるので、効率は犠牲 になる。さらに、汎用のOS機能は通常、対象の並行オ ペレータの意味規制に対して不感であるため、それらは コンパイル時間あるいは実行時間の点で最適化をほとん ど、あるいはまったく行わない。

## [0012]

【発明が解決しようとする課題】高度並列マルチプロセッサ/マルチコンピュータ・システムを制御するため、現代のプログラミング警託に対する非常に効率の良いサブストレートとして役立つコンピュータのオペレーティング・システム、アーキテクチャを用いた高度並列コンピュータ・システムの制御方式が得られる。更に、本発明によれば、カスタマイズ可能な仮想マシンにもとづく非同期の計算のためのソフトウエア・アーキテクチャを用いた高度並列コンピュータ・システムの制御方式が得られる。

[0013] また、本発明によれば、仮想プロセッサ上 でファーストクラスのオブジェクトとしてライトウエイ ト・スレッドをサポートするソフトウエア・アーキテク チャを用いた高度並引コンピュータ・システムの制御方 式が得られる。

[0014] 更に、本発明によれば、カスタマイズ可能なポリシー・マネージャを、特にユーザ・レベルに含むソフトウエア・アーキテクチャを用いた高度並列コンピュータ・システムの制御方式が得られる。

[0015] また、本発明によれば、カスタマイズ可能な仮想トポロジーを含むソフトウエア・アーキテクチャを用いた高度並列コンピュータ・システムの制御方式が得られる。

【0016】また、本発明によれば、スレッド吸収、遅延TC B割り当て、ならびに記憶装置共有の場所として のスレッド・グループを含むソフトウエア・アーキテク チャを用いた高度並列コンピュータ・システムの制御方 式が得られる。

【0017】更に、本発明によれば、多様な形態のポートを含むソフトウエア・アーキテクチャを用いた高度並列コンビュータ・システムの制御方式が得られる。

【0018】また、本発明によれば、上述のようなソフ

トウエア・アーキテクチャを用いて制御されるコンピュータ・システムが得られる。

### [0019]

「課題を解決するための手段」 本発明によれば、高度並 ア・アーキテクチャを用いた高度並列コンピュータ・システムを制御するためのソフトウエ ア・アーキテクチャを用いた高度並列コンピュータ・システムの制御方式において、一つのマイクロカーネルを 形成する複数の抽象物理的ブロセッサを備えた複数の伝想マシンと 前記視数の仮想ブロセッサを備えた複数の仮想プロセッサとであるとを特徴とフレッドを備えた複数のスレッドを指えたが記機数の仮想プロセッサよでプレッドをが入ってとを備え、前記模数の仮想プロセッサおよび前記複数のスレッドはファーストクラスのオブジェクトであることを特徴とする ソファーストクラスのオブジェクトであることを特徴とする ソファーステンステムの制御方式が得られる。

【0020】 更に本発明によれば、各々が仮想プロセッ サ・コントローラと仮想プロセッサ・ポリシー・マネー ジャとを有し、物理的トポロジーにおいて接続された複 数の抽象物理的プロセッサと;各々が、仮想アドレス空 間と複数の仮規プロセッサとを有する複数の仮想マシン と;を備えたコンピュータ・システムであって、前記複 数の仮想マシンの各々の前記複数の仮想プロセッサは、 前記仮想プロセッサ・コントローラ及び前記仮想プロセ ッサ・ポリシー・マネージャに応答して実行し、かつ、 スレッド・コントローラとスレッド・ボリシー・マネー ジャとを有し、前記複数の仮想プロセッサは仮想トポロ ジーにおいて接続され、各仮規プロセッサはそれぞれの 抽象物理的プロセッサにマッピングされており、前記コ ンピュータ・システムは、前記スレッド・コントローラ と前記スレッド・ポリシー・マネージャとに応答する前 記複数の仮想プロセッサ上でランする複数のスレッド を、更に、備えていることを特徴とするコンピュータ・ システムが得られる。

のコンテクストにおいて広い範囲の並行構造体を表現することを可能とする調整サプストレートの実現に関するしてある。本発明は汎用開撃モデルを定義し、そのモデル上で、多数の特殊調整言語を効率良く実現できるようにする。本発明の実施においては、ソフトウエアのスーム(Scheme)(AP Revised Report on the Algorithmic Language Scheme" AC M Sigplan Notices, 21 (12), 1986, Jonathan Rees and William Clinger)を計算の基礎として用いた。スキー人はより高次の、持着的に見たとの、Lispの方言である。スキー人は望ましい言語ではあるが、当業者にとって明らかなように、上記職整サブストレートの設計は、いかなる現代の(高レバルの)プログ

【0021】本発明は、高レベル・プログラミング言語

ラミング言語にも取り入れることができよう。

【0022】本発明のオヘレーティング・システムは基本的に、共有メモリあるいは分離メモリを用いた、Mリ MD(マルチ・インストラクションーマルチ・データ) 並列コンビュータ上でランするように設計され、またワークステーションのネットワークから成る分散マシン上でデータを表している。本発明のソフトウエア・アーキテクチャでは、分離メモリあるいは分散メモリルを用いたマシン上で実行する場合には、共有仮想メリカーにアシストを開いた。上記世列には結果世別、オスター/スレーブなり、ならびには野地が出来のである。その大力に対応する多数の異なるアルコリズムを利いた。上記世列には精巣世別、オスター/スレーブなが、カリストクラスのタブル(81)空間、ならびにはアンターの大力で表している。マージャー・ファーストクラスのタブル(81)空間、ならびにはアンシを備えたないと一ティング・システムとで実現した。

【0023】 本発明の望ましい実施例のフィーチャーで

ある、オペレーティング・システム (OS) を様成する スキームの方言(スティング(Sting)と呼ぶ) は、非同期、ライトウエイトの並行性を表現するための 調整言語(専用仮規マシンによって実現)を含み、それ は2つのアプローチの最良点を組み合せている。他の並 列スキームのシステムおよび問種の高レベル書語の並列 方言と異なり、スティングにおける基本的な並行オブジ ェクト(スレッド、仮想プロセッサ、ならびに物理的プ ロセッサ)は、ストリームライン化したデータ構造であ り、複雑な問期化を必要としない。並行性の管理をOS によるサービスに依存する並列システムと違い、スティ ングはスキームのオブジェクトおよびプロシージャによ ってすべての並行管理の問題を実現し、その結果、ユー ザは、背後のOSのサービスに関する知識を持つことな く、アプリケーションのランタイムの振舞を最適化する ことが可能となる。スティングは、さまざまな形態の非 同期の並列性を生成し、管理するための基本的な特徴 を、概念的に単一化したフレームワークで、かつ非常に 一般的なフレームワークによってサポートする。結果と して、高レベル書語の種々の並列方書をその上に機築で きる効率的なサブストレートを構築できることが分っ た。スティングは単に、スタンドアロンの、短寿命のプ ログラムを実現する媒介手段とすることを意図したもの ではなく、並列計算のための豊かなプログラミング環境 を構築するためのフレームワークを提供することを期待 したものである。従って、このシステムは、スレッド・ プリエンプション、スレッドごとの非同期のガーベッジ ・コレクション、スレッド境界を越えた例外の扱い、な らびにアプリケーションに依存するスケジューリング・ ポリシーをサポートする。さらに、このシステムは、持 続性の長寿命なオブジェクト、マルチ・アドレス空間、 その他、搬新のプログラミング環境に共通する特徴を扱 うために、必要な機能を有している。

【0024】スティングでは、仮想プロセッサは抽象物理的プロセッサ上で多重化され、スレッドは仮想プロセッサ上で多重化される。この多重化に関連するポリシーの決定はすべて、ポリシー・マネージャによって行われる。物理的プロセッサ上の仮想プロセッサかり季重化に関連する決定は、仮想プロセッサ・ボリシー・マネージャ(VPPM)によって行う、仮想プロセッサ上のスレッドの多重化に関する決定はスレッド・ボリシー・マネージャ(TPM)によって行う、仮想プロセッサーのスレッドの多重化に関する決定はスレッド・ボリシー・マネージャ(TPM)によって行われる。

[0025] ボリシー・マネージャは3つのタイプの決定を行う。すなわち、オプジェクトが生成あるいは再開されたとき、プロセッサ (物理的あるいは使) に新しいオプジェクト (VPあるいはスレッド) をいかにマッピングもれた複数のオプジェクトをランさせる順序、ならびにオプジェクトをあるプロセッサから他のプロセッサに、いつ再マッピンがあるいは移動するかの3つである。

【0026】スティングは、スキーム、スモールトーク (Small Talk)、ML、モジューラ3(Mo dula3)、あるいはハスケル(Haskell)な どの現代のプログラミング言語をサポートするように設 計されたオペレーティング・システムである。スティン がは、低レヘルの直交構築体の基礎を与え、それによって言語の設計者あるいは使用者が、上記言語が必要とす る種々の構築体を簡単かつ効率的に構築することを可能 とする。

[0027] 現代のプログラミング言語は、従来のコボル、フォートラン、C、あるいはバスカルなどのプログラミング言語に比べ、より多くを要求する。スティングは現代のプログラミング言語をサポートするように設計されてはいるが、従来のプログラミング言語も同様に効率良くサポートする。現代のプログラミング言語が従来の言語と概なる点を以下にリストアップする。

[0028]・並列性: 汎用のマルチ・プロセッサはますます利用し易くなってきており、その結果、並行プログラミングのための効率的で、かつ表現力に優れたブラットフォームの構築に対して興味が高まっている。高レベルのプログラミング言語に並行性を組み入れるための努力は大部分が、特殊目的の基本命令を言語に付加するという点に払われている。

【0029】・マルチ同期化モデル:並列プログラミングあるいは非同期プログラミングにおいて、多くの同期 化プロトコルが用いられている。現代のオペレーティン グ環境は、できる限りさまざまなプロトコルをサポート する基本命令を提供するものでなければならない。

【0030】・レイジー(遅延)評価およびイーガー評価:現代の多くの言語はレイジー評価あるいはイーガー評価のいずれか、または両方をサポートしている。オペレーティング・システムにとって、レイジーからイーガーまでの完全な評価ストラデジーを用意することは重要

である。

【0031】・自動記憶管理:これは現代の多数の言語 の基本的な特徴となっている。それは、自動記憶管理に よってプログラムを一層、表現力に優れたものにでき、 同時にプログラムのエラーを低減し、かつプログラムの 複雑さを緩和できるからてある。

[0032]・トポロジー・マッピング:多くのプログ ラミング言語ではまだサポートされていないが、プログ ラムにおける通信オーバーヘッドを低減するように、処理のプロセッサへのマッピングを制御する能力は、マルチ・プロセッサ・コンピュータ・システムのサイズが大きくなり続け、かつトポロジーがより複雑になる以上、より重要なものとなろう。

[0033] スティングはこれら種々の要素を効率良く サポートする。スティングは、現在利用できるものより 一層、一般的でかつより効率的なアーキテクチャ・フレ ームワークにおいてこれを行う。スティングはまた、高 い表現力および制御能力と、非並列レベルのカスタマイ ズ能を、プログラムに提供する。

【0034】スティングは、その設計における4つの特徴によって、他の並列言語から最もよく区別できる。

[0035] 1. 並行抽象体:並行性はスティングでは 制御のライトウエイト・スレッドによって表現される。 スレッドは非厳密な、ファーストクラスのデータ構造で ある。

【0036】2. プロセッ対論像体およびポリシー抽象体:スレッドは、スケジューリングあよび負荷平断・デ東行ったの地線体を表す仮想プロセッサ(VP)上で行った。仮想プロセッサの数は、実際に利用できる物理のプロセッサの数はり多くてもかまわない。スレッドのように、仮想プロセッサはファーストクラスのオプジェクトである。1つのVPは1つのスレッド・ポリシー・マネージャを備え、このポリシー・マネージャはそれがまかりを開え、このポリシー・マネージャはそれがまた決定する。異なるVPは、実際には、性態の低下無しに、異なるポリシー・マネージャを備えることができる。仮想プロセッサは、実際の物理的計算装置である物理的プロセッサ上で実行する。

[0037] 仮想プロセッサの集まりとアドレス空間と は組合わさって、1つの仮想マシンを形成する。複数の 仮想マシンが単一の物理的マシン上で実行できる。物理 的マシンは1組の物理的プロセッサから成る。仮想マシンおよび物理的マシンもまた指示可能な、スキームのオ プンカよびかであり、このオブジェクトとして操作可能で ある。

【0038】3. 記憶モデル:1つのスレッドはデータを、そのスレッドが耕他的に管理するスタックおよびヒーブに割り当てる。従って、複数のスレッドは、互いに独立にそれらのプライベート・ステートのガーベッジ・コレクションを行う。あるスレッドがプライベートのガ

ーベッジ・コレクションを始動する場合、グローバルな 同期化は不要である。データはスレッドを横断して参照 できる。スレッド境界を越えてオブジェクトのガーベッ ジ・コレクションを行うとき、領域間の参照情報が用い られる。記憶は代くスキャベンジング・コレクタによっ て管理される。1つのスレッドによって割り当てられた 長寿命データあるいは持続データは、同じ仮規マシンに おける他のスレッドもアクセスできる。

[0039] 本発明の設計は起機のローカリティという ことに配慮している。例えば、スレッドをランさせるた めの記憶装置はVPにキャッシュされ、そして1つのス レッドが終了したとき、すぐに再利用できるようリサイ クルされる。さらに、複数のスレッドは、データの依存 性が保証されるときは常に、同じ実行コンテクストを共 有することができる。

【0040】4. プログラム・モデル:スティングは、 スレッド間で機断的に扱われるべき例外を許容し、ノン・プロッキング I/Oをサポートし、仮想プロセッサの スケジューリングのカスタマイズを、仮想プロセッサレ のスレッドのスケジューリングがカスタマイズ可能であ るのと同様に、可能とし、そしてマルチ・アドレス空間 および共有持続オブジェクトを実現する内部構造を与え る。スティングはまた、ファーストクラスの多様な形態 のボートを用いたメッセージの数率の良い受け達しをサ ボートする。ボートは、分離メモリ・ブラットフォーム 上の共有メモリの実現において、オーバーヘッドを緩和 するのに役立つ

【0041】本発明の高度並列コンピュータ・システムを制御するソフトウエア・アーキテクチャでは、オペレーティング・システム(スティング)、基本書館、ならびにコンパイラを1つの抽象的マンに統合する。スタート点はスキームなどの高しベルソログラミング書語である。このプログラミング言語は、スレッド、仮想プロセッサ、ならびにボリシー・マネージャを含む効率的な事体をはによって拡大されている。この優れたオペレーティング・システムは、データのローカリティにプレミアムを付けるという現在のアーキテクチャのトレンドを有効に利用したメカニズムを含んでいる。

[0042] その結果、並列計算のための効率の良い調 整構造体を構築するメカニズムが得られた。ライトウエ イトのスレッドを用いることにより、進歩的なプログラ ミング環境の基礎が得られる。データのローカリティを サボートすることによって、効率的な非同期システムが 得られる。

[0043] このシステムの性能にとって中心的なことは仮想トポロジーの概念である。仮想トポロジーは、仮想プロセッサの集まりにおける関係を定める。ツリー、グラフ、ハイバーキューブ、ならびにメッシュとして構成されたプロセッサ・トポロジーはよく知られたその例である。仮想プロセッサは、スレッドが実行するスケジ

ューリング、マイグレーション、ならびに食命平衡のボ リシーを定義する抽象体である。この仮想トポロジー は、複雑なスレッドとプロセッサのマッピング (物理的 相互接続の低レベルの詳細を抽象する)を定める、単純 で表現力に優れた高レベルのプレームワークを与えるよ う窓回されている。

[0044] 計算によって生成されたスレッドは、仮想 トポロジー内のプロセッサに対して、そのトポロジーに 関連したマッピング機能によってマッピングされる。ユ ーザはこれらのマッピング機能を定義することができ る。仮想トポロジーを用いて特定のマルチフロセッサ・ ブラットフォーム上でシステんが実現されている場合、 仮想トポロジー内の仮想プロセッサをブラットフォーム 内の物理的プロセッサはアジャを 定義することが可能である。

[0045] コードそれ自身は、それが物理的プロセッサあるいは物理的プロセッサの相互接続に対する参照を含んでいない限り、マシンとは独立している。スレッド・マッピングとローカリティに関するすべてのことは、プログラムが用いる、仮想トポロジーの仕様と、プログラム実行時のトポロジー内のノードの通過の仕方において抽象される。

【0046】仮想トポロジーとプロセッサ・マッピング の利益は、効率性だけでなく、移植性という点にもあ り、それによって並列アルゴリズムの実現を個別の物理 的トポロジーごとに特殊化する必要がなくなる。スレッ ドをプロセッサに関連づけるマッピング・アルゴリズム は、仮想トポロジーの一部として細かく指定されるの で、プログラマは、スレッドがどのように仮想プロセッ サに対してマッピングされるべきかを正確に管理でき る。ある計算において通信が必要となることが分かって いる場合、これらのスレッドを特定の仮想プロセッサに 明確に割り当てられるという能力によって、暗黙的なマ ッピング・ストラテジーの場合より優れた負荷平衡を行 える。並列アルゴリズムによって定義される制御とデー タフローのグラフの構造は、種々の形で用いることがで きる。スレッドの集まりが共通のデータを共有している 場合には、これらのスレッドが実行する仮想プロセッサ を同一の物理的プロセッサにマッピングするトポロジー を構築することが可能である。仮想プロセッサは物理的 プロセッサ上で、スレッドが仮想プロセッサ上で多重化 されるのと同じようにして多重化される。あるスレッド の集まりが重要な相互の通信を必要とする場合には、そ れらのスレッドを、仮想トポロジーにおいて互いに接近 したプロセッサにマッピングするトポロジーを構築する ことができる。スレッドT1 が、他のスレッドT2 が発 生する値に対してデータ依存性を有している場合、T<sub>1</sub> とT2 とは同一の仮想プロセッサにマッピングすること が合理的である。プロセッサがほとんどビジー状態とな るグラニュラリティの細かいプログラムでは、同一また は近いプロセッサ上のデータ依存スレッドに対してスケ ジューリングを行える能力によって、スレッドのグラニ ュラリティを改善する機会か与えられる。最後に、適応 ツリー・アルゴリズムなど、ある種のアルゴリズムは計 育の進行につれて展開するというプロセス構造を有して いる。これらのアルゴリズムは、仮想プロセッサの動的 生成が可能なトポロジー上において最も良く実行され る。

【0047】このソフトウエア・アーキテクチャの他の優れた面として、効率的な汎用のマルチ・スレッドのオペレーティング・システムおよびプログラム環境の実現における。コンティニュエーションおよびファーストクョンは、状態選移の操作、例外の扱い、ならびに重要な記憶の最適化を実現するために用いられる。コンティニュエーションは、プログラム・ボイントの抽象体である。コンティニュエーションは、プログラム・ボイントの抽象を有するプロシージャによって表され、このプロシージャは、引数が示すプログラム・ボイントから実行すべき残りの計算を定義している。

【0048】スティングの仮想アドレス空間よ1組の領域によって構成されている。領域は、一時的にあるいは空間的に強いローカリティを示すデータを組織化するために用いられる。スティングはさまざまな領域をサポートする。すなわち、スレッド制御ブロック、スタック、スレッド・ブライベート・ヒーブ、スレッド・持有ヒーブなどである。データは、それらの意図された仕様および寿命にもとついて領域に割り当てられ、従って異なる領域は、それらに関連した異なるガーベッジ・コレクタを備入ることになる。

【0049】例外と割り込みは常に、スレッド・レベル のコンテクスト・スイッチの場合のように、あるスレッ ドの実行コンテクストにおいて扱われる。例外ハンドラ ーは通常のスキームのプロシージャによって実現され、 そして例外のティスパッチは基本的にコンティニュエー ションの操作を含んでいる。

[0050] スティングが、制御のライトウエイト・ス レッドの生成および管理が可能なプログラミング・シス テムである限り、いくつかか特性を、他の高 Lへ小言語 のために開発されたスレッド・パッケージ・システムと 共有している。これらのシステムもスレッドを明らかな データタイプと見ており、また、さまざまな程度にプリ エンプションをサポートし、そしてある限定されたケー スでは、プログラマが特別のスケジュール管理を指定す ることを可能としている。これらのシステムでは、スレ ッドの抽象体が調整部分言語を定めている。

【0051】しかし、スティングはいくつかの重要な点 でこれらのシステムと異なっている。第1に、スティン グが使用するスケジューリングとマイグレーションのブ ロトコルは完全にカスタマイズできる。異なるアプリケ

ーションは、スレッド・マネージャあるいは仮想プロセ ッサの抽象体を変更することなく、異なるスケジューラ をランさせることができる。このようなカスタマイズは 仮想マシン自身の組織化に適用することができる。第2 に、スティングによるデータのローカリティのサポー ト、記憶の最適化、ならびにスレッドの吸収によるプロ セスの抑圧は他のシステムでは行えない。さらに、スレ ッドのオペレーションはすべてスレッドの仮想マシン内 で直接実現される。スレッドのオペレーションの実行の ために実施すべき、低レベルのカーネルに対するコンテ クスト・スイッチは無い。スティングは、長寿命のアプ リケーション、持続性のオブジェクト、ならびにマルチ アドレス空間をサポートすることを意図した抽象的マ シンにおいて構築される。スレッド・パッケージは、そ れらが (定義によって) 完全なプログラム環境を定めて いないので、これらの機能はまったく提供しない。

【0052】スティングはシステム・プログラミング言 誰として設計されているので、低レベルの平行抽象体を 提供する。アブリケーション・ライブラリは直接スレッ ド・オブジェクトを生成でき、そしてそれら自身のスケ ジューリングおよびスレッド・マイグレーション・スト ラデジーを定めることができる。高レベルの平行棋繁体 はスレッドを用いて実現できるが、しかし効率が保証さ れるなら、システムはユーザがスレッドのオペレーショ かを上述のように直接利用でることを禁止するものでは ない、具体的には、同一のアプリケーションは、同一の 実行時の環境において、異なる意味規制と異なる効率 で、平行4歳後な定めることができる。

【0053】ある点でスティングは、他の進歩的マルチ・スレッド・オペレーティング・システムに似ている。例えば、スティングは、コール・バック、ユーザが管理するオーバー・インタラブト、ならびにユーザ・レベルの操作としてのローカル・アドレス空間の管理に伴うノンブロッキング 1/00 事格とカースル・レベルの事格とカーネル・レベルの事格とかけている。物理的プロセッサは(特権を与えられた)システムのオペレーションを扱う。仮想プロセッサはユーザ・レベルのスレードまよびローカル・アドレス空中の機能をすべて実現する。しかし、スティングはスキームの拡張方言であるため、典型的なオペレーティング・システム環境では提供するない高レベルのプログラミング言語の機能性まよび表現性を提供する。

【0054】スティングは、非同期プログラミング基本 命令を構築し、そして新しい並列プログラミングのバラ ダイムを実験するためのブラットフォームである。さら に、その設計では、異なる平行性の手法を競走的に評価 することが可能である。スキームは、意味規制が良く定 義され、全体的に節素であり、そして効率的であるた め、このような実験を行うための特に豊かな環境を提供 する。しかし、スティングの設計はそれ自身言語に依存 しない。従って、いかなる高レベルプログラミング言語 にも極めて容易に組み込むことができよう。

[0055] スティングは単に、興味深心と思われる各 平行パラダイムおよび各平行プリミティブに対してフッ クを与えるものではない。そうではなく、広範囲の並列 プログラミング構造体に共通の基本構造および機能に無 底を当てている。従って、プロッキングの実現は論理的 な計算をサオートするために容易に用いられる。スレッ ドの実行を即止するために碧いられるスレッド吸収の最 選化は、フューチャーとタブル空間の同期化を実現する のに非常に適しており、そして最後に、カスタマイズ可 能なポリシー・マネージャは、他のさまざまなパラダイ ムに対して公正で効率的なスケジューラを構築すること を可能とする。

## [0056]

【実施例】次に本発明の実施例について図面を参照して 説明する。

[0057] 図1に本発明の一実施例による高度並列コンピュータ・システムを制御するためのソフトウエア・ アーキテクチャを用いた高度並列コンピュータ・システムの制御方式のプロック図を示す。

【0058】 抽象物理的マシン (PM) 10は、物理的トポロシー (PT) 11で互いに接続された抽象物理的プレセッサ (PP) 12により構成された地象や地理的マシンは1組の仮想マシン (VM) 14を実行させるために用いられる。それに対して、各仮想マシン (大M) 14を実行いたの提がではないでは、仮想トポロジー (VT) 20,20'で接続されてつ以上の仮想プロセッサ (VP) 16を備えている。スレッド (T) 18は、同じ仮想マシン内の1つ以上の仮想プロセッサ上で実行する。さらに、特定の入レッドは、同じ仮想マシン14内の異なる仮想プロセッサ間で移行(マイグレート)できる。スレッド・ポリシー・マネージャ (TPM) 19 (図2、図3に示す)・ボリシー・マネージャ (TPM) 19 (図2、図3に示す)・ボリシーを制御する。最な要素間の関係および各要素の詳細を以下に説明する。

【0059】ソフトウエア・アーキテクチャ(オペレーティング・システム・アーキテクチャという場合もある)は、いくつかの抽象体の層の配列と考えることができる(図2)。第1の層は抽象物理的マシン10を含かている。この層は、現状のカイレーティング・システムにおいてマイクロ・カーネルと呼ばれているものに対応している。次の層は仮想マシン14および仮想フロセッサ16を含んでいる。仮想マシンは、仮想アドレス空間と、仮想トオロジーで接続された仮想プロセッサの相とを備えている。仮想フシンはは象物理的マシンにマッピングされ、その際、各仮想フロセッサは神象物理のセッサにマッピングされ、その際、各仮想フロセッサは神象物理のセッサにマッピングされる。抽象体の第3の層はスレッ

ド18である。これらのスレッドは、仮想プロセッサ上でランするライトウエイトのプロセスである。

【0060】仮想トポロジーは、例えば、メッシュ・トポロジーで物理的に接続された物理的プロセッサにマッピングされる仮想プロセッサのソリーである、仮想トポロジーによって、プログラマは、実施すべきアルゴリズムに適した(仮想)トポロジーでフログラムを表現する。ケーゲット・マシンの実際の物理的トオロジーへの効率的なマッピングを提供する。また、仮想トポロジーによって、並列プログラムを、異なる物理的トポロジーの容易に移すことが可能となる。

(0061)スティングの関整部分言語の主な構成要素は、ライトウエイト・スレッドと仮想プロセッサである。スレッドは、ローカル砂酸装置(すなわち、レジスタ、スタック、ならびにヒープ)、コード、ならびに関連する状態情報(すなわち、ステータス、優先順位、プリエンブション・ビット、ロックなど)を含せ単れなテータ構造である。それらは独立した制御の場所を定義している。このシステムは、スレッドが含むコードに対して制約を課さない。有効なスキームの表現はすべて、独立したプロセスとして扱われる。

[0062] 図2, 図3(に示すように、各仮想プロセッサ (VP) 16はスレッド・コントローラ (TC) 17 を含み、このコントローラはソッド上おさびスレッド・ボリシー・マネージャ (TPM) 19上で状態遷移機能を実施する。そして、スレッド・ボリシー・マネージャはスレッドのスケジューリングと負荷平衡/移行リシーの両方を実施する。同じ仮想マシン内で各 VPはスレッド・コントローラを共有するが、異なるVPは異なるスレッド・ボリシー・マネージャを持つことができる

【0063】仮想プロセッサ16は物理的プロセッサ1 2上に、スレッド18が仮想プロセッサ上に多重化され ているのと同じようにして多重化されている。各物理的 プロセッサは、マルチプロセッサ環境における計算エン ジンに対応している。各物理的プロセッサPPに関連し ているのは仮想プロセッサ・コントローラ13および仮 規プロセッサ・ポリシー・マネージャ15である。仮規 プロセッサ・コントローラは、プリエンプションによっ て、あるいは明示的なリクエストによって、仮想プロセ ッサ間でコンテクスト・スイッチを行う。仮想プロセッ サ・ポリシー・マネージャは、物理的プロセッサPP上 で実行する仮想プロセッサ16に対するスケジューリン グの決定を扱う。例えば、仮想プロセッサは、その上で スレッドが実行していない場合、そして他のVPからス レッドを移転できない場合には、物理的プロセッサの制 御を放棄することができる。物理的プロセッサは、シス テム内のいかなる仮想マシンの仮想プロセッサをもラン させることができる。

【0064】仮想マシンは単一のアドレス空間24を含 み、関連する仮想プロセッサはそれを排他的にアクセス することができる。仮想マシンは、グローバル記憶ブー ル26内のグローバルな情報(例えば、ライブラリ、フ ァイル・システムなど)を共有することができ、そして グローバル共有オブジェクト28(すなわち、グローバ ル・アドレス空間にあるオブジェクト)をそれらのロー カル・アドレス空間にマッピングする。仮想マシンはま た、アドレス空間内のすべての活性オブジェクトをトレ ースするために用いられる活性オブジェクト・グラフ (すなわち、ルート環境30) のルートを含んでいる。 【0065】 すべてのスティング・オブジェクト (スレ ッド、VP、仮想マシンを含む)は持続性メモリ内に存 在する。このメモリは個別領域の集合として構成されて いる。オブジェクトは、世代コレクタを用いて領域内に 集められたガーベッジである。1つのオブジェクトはそ のアドレス空間内の他のオブジェクトをすべて参照する ことができる。最初、オブジェクトは短寿命のスレッド ローカル領域に存在する。ガーベッジ・コレクション から生き残ったオブジェクトは世代階層において上位に 移る。この機能はユーザにとっては全く明らかである。 【0066】ファーストクラスのオブジェクトは、ブロ シージャに対して引数として渡したり、結果としてプロ シージャから戻したり、あるいはデータ構造内に記憶で きるオブジェクトのことである。本発明の抽象物理的マ シンの望ましい実施例では、抽象物理的プロセッサ、仮 想マシン、仮想プロセッサ、スレッドのグループ、なら びにスレッドはすべてファーストクラスのオブジェクト である。他の実施例では、スレッドおよび仮想プロセッ サのみがファーストクラスのオブジェクトである。 【0067】スティング・コンパイラはオービット(O

rbit)の改良バージョンである。オービットについ てはD. Kranzらの論文に記述されている(参考文 献: "Orbit: An Optimizing Co mpiler for Scheme", in ACM SIGPLAN Notices, 21 (7):21 9-233. July 1986) 。 コンパイラにより 見えるターゲット・マシンは、現在ランしているスレッ ド・オブジェクトに対する参照を保持する専用のスレッ ド・レジスタを含んでいる。さらに、レジスタをコンテ クスト・スイッチ上で退避、復元したり、あるいはスレ ッドの記憶領域(すなわち、スタックおよびヒープ)を 割り当てたりするといった時間的な制約の厳しいオペレ ーションは、基本オペレーションとして用意される。連 続するスキーム・プログラムは変更無しにコンパイル し、実行される。スティングでは、フューチャー、分散 データ機造、ならびにスペキュラティブ平行オペレーシ ョンも実現している。スキーム・プログラムは、これら のパラダイムのいずれかによってサポートされた平行オ ペレーションによって自由に拡大させることができる。

【0069】スレッドは状態情報をその状態の一部として記録する(図4および図5参照)。スレッドは、遅延36、スケジュール38、評価40、吸収42、あるいは確定44のいずれかの状態をとる。遅延されたスレッドは、スレッドの値が明確に要求されない限り、ランされることはない。スケジュールされたスレッドは、いずれかのVPが知っているスレッドであるが、まだ記憶質減は剝り当でもれていない、評価を行っているスレッドはランし始めたスレッドである。スレッドは、そのサンクのアプリケーションが結果を出すまでこの状態に留金吸収されたスレッドは、評価中のスレッドを特別化したものであり、重要であるため、以下にさらに詳しく説明する。

【0070】状態情報および評価すべきコードに加えて、1つのスレッドはまた、(1)それが完了するのを待っている他のスレッドに対する参照情報と、(2)サンクの動的な、そして例外の環境と、スレッドの親、兄弟、ならびに子を含む系統情報とを含んでいる。

[0071] 名スレッドも、流体(すなわも動的)結合 および例外の扱いを実現するために用いる動的な、そし て例外の環境を有している。系統情報は、デバッグとプ ロファイリングのツールとして有用であり、それによっ てアブリケーションはプロセス・ツリーの動的な展開を モニタすることが可能となる。

【0072】スレッドの実現においては、言語における他の基本オペレーションを変更する必要はない。スレッドの同期代意味規則は、例えばMultiLispの"touch"や、Lindaのタブル空間や、CMLの"sync"によって利用できる同期化機能をより一般的な(低レベルではあっても)形にしたものである。【0073】アブリケーションは状態を完全に制御し、その状態のもとで、ブロックされたスレッドを復活させることができる。しかし、データフロー(すなわちフルチャー・チッ・チッ・チ)、非決定節的な選択、ならびに創約

にもとづく同期化または障壁同期化に対する明示的なシ ステム・サポートがある。

【0074】ユーザは、スレッド・コントローラ(TC、リ、スレッドのある状態において同期状態の濃巻を実する)が完業する1組のプロシージャ(似下にリストアップする)によってスレッドを操作する。 TCは、レジスタの退避および復元という 2つの基本オペレーションを除いて、全体をスキームによって書くことが望ましい。 スレッド・コントローラは記憶領域を制り当てない。 従って、TCのコールはガーベッジ・コレクションをトリガーしない。 これらのオペレーションに加えて、スレッドは、プリエンブションのため、コントローラに入ることができる。スレッド・プロシージャを以下に示す。

【0075】(fork-thread expr v p)は、exprを評価するためにスレッドを生成し、それを<math>vp上でランするようにスケジュールする。

【0076】(dealy-thread expr)は、(スレッド値によって)要求されたときexprを評価する選延されたスレッドを生成する。

【0077】(thread-run thread vp)は、選延された、プロックされた、あるいは保留されたthreadをvpのレディー待ち行列に挿入する。

【0078】(thread-wait thread)は、このオペレーションを実行しているスレッドに、threadの状態が確定するまでブロックさせる

【0079】(thread-block thread . blocker)は、threadにプロックすることをリクエストする。blockerは、スレッドがブロックするときの条件である。

【0080】(thread—suspend thread \_ quantum)は、スレッドに実行の保留をリクエストする。quantum引数か与えられた場合には、指定された期間が軽過したときスレッドは再聞される。そうでない場合には、スレッドは、thread—runを用いて明示的に再聞されるまで、無期限に保留される。

【0081】(thread—terminate thread. values)は、threadにしてvaluesをつめ結果として終了することをリクエストする。(yield—processor)は、現在のスレッドに、そのVPの制御をやめるようリクエストする。このスレッドは適切なレディー待ち行列に挿入される。

【0082】(current-thread)は、このオペレーションを実行しているスレッドを保備する。 【0083】(current-virtual-processor)は、このオペレーションが、その上で評価されている仮想プロセッサを復帰される。

[0084] ユーザがいかにスレッドをプログラムできるかを説明するため、図6のプログラムについて考える。このプログラムは、簡単な素数発見手段の実現を定義したものである。この定義ではいかなる特定の並行バラダイムも警照していない。このような問題はそのop引数によって抽象される。

[0085] この素数発見手段の実現は、ストリーム・アクセスにおけるブロッキング・オペレーション(hd)、およびスレッドの最後に付加するアトミック・オペレーション(attach)を与える、ユーザが定義した同期スレッド抽象体に依存している。

【0086】非同期の振舞の程度が異なる、素数発見手 段の種々の処理を定義できる。例えば、

er-list))))))

では、フィルタがレイジーに生成される。フィルタは、 一度要求されると、反復的に入力ストリームから要素を 除去し、そして潜在的な素数を出力ストリーム上に発生 する。ラウンド・ロビン・スレッド配置規律を用いるV P上でスケジュールした新しいフィルタを始勤させるため、次のように書くことができる。

[0087]

(vp. vm (current-virtual-pr ocessor)) という表現は、現在のVPを一部と する仮想マシンを定義している。仮想マシンのパブリッ ク・ステートは、その仮想プロセッサを収容するベクト ルを含んでいる。

【0088】シーブに対する上記コールを少し書き直す ことにより、よりレイジーな素数発見手段の実現を表現 できる。 [0089]

この定義では、潜在的な素数りに遭遇したフィルタは、 レイジーなスレッド・オブジェクトしを生成し、チェー ン内の他のすべてのフィルタにブロックすることをリク エストする。Lの値が要求されたときは、フィルタはチェーン内のすべての要素をアンロックし、そしてその入 カスレッドにおけるののすべアの何終数を別り終く、この コールでは要求にもとづいて、シーブの拡張および入力 の消費を抑制する。

【0090】 このシーブは次のように、よりイーガーな バージョンに変えることもできる。 【0091】

(sieve (lambda (thunk)

 $(fork-thread-(thunk)\ (curre \\ nt-vp)))$ 

n)

このアプリケーションを評価することによって、素数の すべての倍数を取り除くための新たなスレッドがスケジ ュールされる。このスレッドは、この操作を実行する仮 想プロセッサ上でスケジュールされる。このコールで は、素数が新たに見つかることに、評価するスレッドが 発生される。

[0092] スティングでは、スレッドのオペレーションを通常のブロシージャとして扱い、スレッドのオペレーションで参照されるオブジェクトを、スキームのどれか他のオブジェクトとして操作する。共通のストリームによって転ばれた2つのフィルタが終了した場合、上記ストリームが占有する記憶領域は再利用することができる。スティングは、スレッドのアクセスに対して先験的な同期化プロトコルを課さない。アブリケーション・ブログラムが、スレッドの調整を整える抽象体を構築するようにしている。

【0093】フィルタによって生成されたスレッドは2 つの方法の中の1つによって終了される。シープに対す るトップレベルのコールは、それがこれらのスレッドに 対して明元的なハンドルを有するように、構成すること ができる。レイジーなシーフを生成するために用いるフ ィルタ・リスト・データ構造はその一例である。次に、 (map thread-terminate fil ter list)

を評価して、シーブ内のすべてのスレッドを終了させる ことができる。あるいは、アブリケーションはスレッド のグループを用いて、これらのスレッドを集合的に管理 することができる。

【0094】 <スレッド・グループ>スティングは、関連するスレッドの集まりに対する制御を獲得する手段と してスレッド・グループを与える。1つのスレッド・グループは、forkーthread「タroupに対するコールによって生成される。このオペレーションは、新しいグループおよび新したメレッドを生成し、新しいスレッドは新しいグループのルート・スレッドになる。子スレッドは、折しいグループを明示的に生成しない限り、同一のグループを、その終として共有する。1つのグループは1つの共有ヒーブを含み、そのメンバーはすべてこのヒーブをアクセスできる。スレッド・グループが次のコールによって終了したき、

(thread-group-terminate group) がループ内の生きているスレッドはすべて終了され、そ の共有ヒーブはガーベッジ・コレクトされる。

【0095】スレッド・グループはまた、そのメンバー に対して、それをすべてひとまとめにして適用できるデ バッグ・オペルーションおとびスレッド・オペルーショ ンも含んでいる。スレッド・グループは、デバッグおよ びモニタのためのオペレーション(例えば、与えられた グループ内のオペアのスレッド・のリストアップ、すべて のグループロリストアップ、プロファイリング、系統の 報告など)と共に、通常のスレッドのオペレーション (例えば、終了、保留など)と同種のオペレーションを

提供する。従って、スレッドTが終了したとき、ユーザ

はTのすべての子(終了されるべきTのグループの一部 として定義されている)に対して次のようにリクエスト できる。

[0096] (thread-group-termi

nate (thread.group T)) スレッド・グループは、階層的メモリ・アーキテクチャ において、共有を制御するための重要なツールである。 グループのメンバーが共有するオブジェクトは、グルー プの共有ヒープ内に含まれているので、これらオブジェ クトはメモリ内で物理的に互いに近接していることが望 ましく、それによってより良いローカリティが得られ る。スレッド・グループはまた、スケジューリングの場 として用いることもできる。例えば、スレッド・ポリシ ー・マネージャは、グループ内のすべてのスレッドがラ ンすることを許可されない限り、グループ内のスレッド はいずれもランできないというスケジューリング・ポリ シーを実現できよう。このスケジューリング方式は"ギ ャング・スケジューリング"プロトコルと間種のもので ある。スレッド・グループはデータのローカリティを改 養するために仮想トポロジーと共に用いることができ

【0097】〈実行コンテクストおよびスレッド制御ブ ロック>スレッドが評価を開始したとき、実行コンテク ストがそれに対して割り当てられる。評価を行っている スレッドはいずれも、スレッド制御ブロック(TCB) 32 (図5) としても知られる実行コンテクストと関連 している。TCBはコンティニュエーションを一般的に 表したものであり、それ自身のスタック31とローカル ・ヒープ33を含んでいる。 スタックとヒープはともに 拘束でき、そしてヒープは生成スキャベンジング・コレ クタを用いてガーベッジ・コレクションされる。記憶オ ブジェクト以外に、TCBは関連するロックと、スレッ ドが最後にコンテクスト・スイッチを実行したとき残っ ている、生きたレジスタすべての値と、スレッドのサブ ステート(例えば、初期化、レディー、評価、ブロッ ク、保留などの状態)と、スレッドが最後に実行された VPと、スレッドの優先順位と、タイム・クオンタムと を含んでいる。

【0098】スレッド・ステートおよびスレッド・サブ ステートの連移図を図 4に示す。TCBの状態は、評価 を行っているスレッド上で許可されたオペレーションを 反映している。評価中のスレッドTがTCB TICBを 有しているなら、TICBのステート・フィールドは以下 の中のいずれか1つを示す。

【0099】初期化46:TTCB に関連するスタックと ヒーブが初期化されているが、どのコードもまだ実行されていない。

【0100】レディー48:Tは利用できるいかなるV P上でも実行できるが、いずれのVP上でも現在、まだ 実行されていない。 【0 1 0 1】 ラン 5 0 : Tはある V P上で現在実行されている。

【0102】ブロック52:Tは、あるスレッド上で、 またはある条件のもとで現在ブロックされている。

【0103】保留54: Tは、基本的に無期限に保留されている。

【0104】終了56: Tは実行を終了し、残りの状態を一掃している。

【0 1 0 5】スレッドとは販丸り、TCBはファースト クラスの、ユーザに見えるオブジェクトではない。スレ ッド・コントローラとスレッド・ボリシー・マネージャ のみがそれらをアクセスできる。新しいスレッドがラン のレディー状態にあるとき、TCBはそれに割り当てら れる。スレッドが確定状態となったとき、スレッド・コ ントローラはそのTCBを、後に生成されるスレッドの ために、利用できる。TCBはユーザが維持するデータ 構造内に選げ込むことはない。TCBはステム・レベ ルのプロシージャによって評他的に操作される。

【0106】スティングの実現はスレッドに対する記憶 領域の割り当てを必要となるまで延期する。他のスレッ ド・パッケージでは、スレッドを生成する動作は、単に フォークされるべきスレッドに対する環境を設定するだ けでなく、記憶領域の割り当ておよび初期化も含んでい る。このアプローチでは2つの重要な点で効率の低下を 招く。第1に、グラニュラリティの細かい並列のもとで は、スレッド・コントローラは、実際にスレッドをラン させることより、それらを生成し、初期化することに、 より長い時間を消費する。第2に、スタックおよびプロ セス制御ブロックはスレッドが生成されると直ちに割り 当てられるので、スレッド間のコンテクスト・スイッチ はしばしば、キャッシュとページのローカリティの利点 を活用できない。さらに、TCBの割り当てが遅延され ない場合には、システムに必要な全メモリ容量は大幅に 増加することになる。

【0107】スティングのスレッド制御プロックは、仮 世プロセッサによって管理されるリサイクル可能な資源 である。TCBは、スレッドが評価を開始したときのみ スレッドに対して割り当てられる。この割り当てのスト ラデジーはデータのローカリテを改善するように設計 されている。TCBは、VP V上でランするべきスレ ッドTに対して4つの方法の中の1つによって割り当て ることができる

【0108】1. 現在V上で実行中のスレッドが終了し た場合には、そのコンテクストは直ちに再割り当てのために利用できる。そのTCBは割り当てのための最も良 い候補である。なぜなら、このTCBは、そのVPに対 して最も高いローカリティを有しているからである。こ のVPに関連する物理的キャッシュおよびメモリは、最 も最近VP上でランしたスレッドの実行コンテクストを 含んでいる可能性が最も高い。 【0109】2. 現在実行しているスレッドが終了していない場合には、下に対するTCBは、V上に維持されているTCBのLIFOプールから割り当てられる。こでも再び、上記実行コンテクストが、最も高いローカリティを有するものとなっている。

【0110】3. Vのブールが空の場合には、新しいTCBが、これもLIFOの順序で構成されたグローバル・ブールから別当てられる。ローカルVPプールはいずれも、それが保持できるTCBの数のしきい値 r を維持している。ブールがオーバーフローした場合には、そのVPは、ローカル・ブール内のTCBの半分をグローバル・ブールに移動する。ローカル・ブールかオーバーフローしていない場合には、r/2TCBがグローバル・ブールからVPの一カル・ブールは多かされる。グローバル・ブールは2つの役割を果たす。すなわち、

(1) TCBの割り当ておよび再使用におけるプログラムの振舞の影響を最小化すること、および (2) すべての仮想プロセッサに対するTCBの公正な分配を保証することである。

【0 1 1 1 】 4. 最後に、TCBをグローバル・ブール あるいはローカル・ブールのいずれにおいても利用でき ない場合には、T/2TCBの新しい根が動向に生成さ れ、Tに割り当てられる。新しいTCBは、グローバル ・ブールおよびVPのローカル・ブールがともに空の場 合にのみ生成されるので、スティング・ブログラムの評 個の際に実際に生成されるTCBの数は、すべてのVP によって集舎的に決められる。

【0112】 く仮想プロセッサン仮想プロセッサ (鉱長 して、仮想マシン) は、スティングではファーストクラ スのオブジェクトである。ファーストクラスというVP の状態には、スティングを高レベルのスレッド・システ ムおよび他の非同期並列言語のいずれからも区別する重 要な意味がある。第1に、明示的にプロセスを特定の仮 想プロセッサにマッピングすることによって並列計算を 組織できる。例えば、VP V上で実行している他のス レッドQと密接に通信することが知られているスレッド Pは、トポロジー的にVに近いVP上で実行すべきであ

address 0)))) 1. 適当な物理的プロセッサにマッピングされる仮想プ

ロセッサの組を生成する。
【0116】2. 仮想トボロジーにおけるアドレスを各

V Pに関連づける。 【0117】3. 仮想トポロジーにおいて絶対アドレシ

し、その構造上に適切なアクセスルーチンを定義する。 【0118】4、自己相対アドレシングのプロシージャ る。スティングでは、VPは直接的に示されるので、こ のような事態を実現することができる。例えばシストリ ック・スタイルのプログラムは、現在のVP(例えば、 現在VP、左VP、右VP、上VPなど)から離れて自 日相対アドレシングを用いて表現することができる。こ のシステムは、多数の共通トボロジー(例えば、ハイバ ーキューブ、メッシュ、シストリック・アレーなど)に 切していくつかのデフォールト・アドレシング・モード を提供する。さらに、VPは特定の物理のプロセッサに マッピングできるので、ファーストクラスのデータ値、ス ティングのプログラムは、種々の特定のプロセッサ、ト ボロジーで定義される異なる並列アルゴリズムを極めて 柔軟に表現することができる。

【0113】図7のプログラムを参照して説明する。このプログラムは、物理的プロセッサの2次元メッシュ上で多重化された仮想プロセッサの3次元メッシュを生成するものである。このアレーは、物理的マシンの高さおよび幅と同じ高さおよび幅を有している。深さ方向の各要素を同じ限想プロセッサにマッピングすることによって、3次元アレーを2次元アレーに縮小する。従って、は成された仮想プロセッサの数は、物理のプロセッサにマッピングされたスレッドはすべて同じVP上で実行する。プロシージャgetーphートeightとgetーpmートeightとgetーpmートeightとgetーpmートeightとgetーpmートeightとgetーpmートeightとgetーpmートeightとgetーpmートeightとgetーpmートeightとpvーへの単純なアレー参照である。仮想プロセッサの絶対アドレシングは、createー3Dーmeshだけ戻したアレーへの単純なアレー参照である。

【0114】Create-vpプロシージャは、ge t-ppが戻した物理的プロセッサンで走る新しいVP を生成する。トポロジーが生成されると、現在のVPから離れて自己相対アドレシング・プロシージャを構築することが可能である。例えば、トポロジーにおいて1ディメンジョン上方に移動する上VPプロシージャを定義 することができる。

を定義する。

[0115]

【0119】 〈スレッド・コントローラ〉スレッド・コントローラは、仮想プロセッサによる、物理炒了セッサによる、物理炒了セッサやスレッドなど、他のシステム要素とのやり取りを扱う。スレッド・コントローラの最も重要な機能は、スレッドの状態遷移を扱うことである。スレッドが、その状態遷移によって、現在その上でランしている仮想プロセッサを生じた場合には、必ずスレッド・コントローラは

スレッド・ポリシー・マネージャをコールし、次にどの スレッドをランするべきかを決める。

【0120】スティングのスレッド・コントローラを実現する場合、いくつかの興味深い問題が明らかになる。中心的な状態遷移プロシージャで見られるTCBでの操作は、ユーザ・アブリケーションでは利用できない。スレッド・コントローラはスティングの中に書かれているので、TCブロシージャに対するすべての同間コールは通常のブロシージャ・コールとして扱われる、後って、現在のスレッドでランしているプロシージャが用いる活性レジスタは、コントローラへのエントリのとき、スレッドのTCBKに自動的に誤算される。

[0121] プロシージャstartーcontext ーswitch (図8) は、その引数として、現在のス レッド (すなわち、TCに入ったスレッド) に対する望 ましい次の状態をとる。プリエンプションは最初にディ スエープルされる。次に、新しいスレッド (あるいはT CB) が、プロシージャtpmーgetーnextーt hreadによって復帰される。

【0122】ランできるスレッドが無い場合には、プロシージャは偽(false)を戻す。この場合、現在のスレッドは肩度ランされるか(レディー状態にあるとして)、あるいはブロシージャtpm-vp-idleが、現在のVPを引数としてコールされる。プロシージャtmp-vp-idleは穏々の簿記機作を行うことができ、また。その物理的プロセッサに他のVPに切り換えるようリクエストすることができる。

【0123】次のオブジェクトが現在のTCBである場合、動作は一切行われず、現在のスレッドが画ちに再開される。戻されたオブジェクトが他のTCBの場合には、その状態がランに設定され、VPフィールドは現在のVPに設定される。そして、現在のTCBは(その状態がデッドの場合)TCBアール内でリサイクルされるか、またはそのレジスタが遊避され、そして新しいTCBの状態が、ブロセッサ・レジスタに復元される。【0124】戻されたオブジェクトが、実行コンテクス

トを持たないスレッドの場合には、TCBがそれに対して割り当てられる。このTCBは、nextーstatenのフィールドがデッドの場合には現在のTCBとなる。あるいはVPローカル・ブールまたはつローバル・ブールから割り当てられるTCBとなる。スレッドは、基本プロシージャstartーのといるでは、その実行コンテクストとして新しいTCBを用い、プロシージャstartーnewーthread(図10参照)を応用する。[0125] finishーcontextーswitchのコード(図9)は、startーcontextーswitchが復帰させたスレッドによって実行さる。その目的は、新しいスレッドによって実で言る。その目的は、新しいスレッドによって実行さる。その目的は、新しいスレッドによって実行さる。その目的は、新しいスレッドのVPフィールドを設

定するためにスイッチ・アウトされたスレッド(このブ ロシージャ内で以前にコールされている)が保持するロ ックを解放し、適切であるなら以前のものをレティー待 ち行列に組み入れ、プリエンプションタイムを再設定す る。新しいスレッドがVP上に設定された後でのみ以前 のものを待ち行列に組み入れることにより、フトリー ラは、状態運移を起させることと、スレッドをVPのレ ディー特も行列に組み入れることとの間の競合状態を排 除する。プロシージャ tmpーenqueueーsus pendedーthreadと、スレッド・ポリシー・ マネージャによって来期される。

[0126] start-new-threadの□-ドを図10に示す。サンクE+ を有するスレッド・オブ ジェクトは、それに対してTCBが割り当てられると、 評価を開始でき、そしてデフォルト・エラー・ハンドラ 一および適当なクリンアップ・コードと関連するように なる。 Et から出るためのスロー(start-new - threadが設定するキャッチポイント)はスレッ ド・スタックに適切に巻き戻させ、それによってスレッ ドが保持するロックなどの資源が適切に解放されるよう にする。E+ の評価に続く退出のコードはスレッドのス タックとヒーブをガーベッジ・コレクションし、E+が 生成した値をスレッド状態の一部として格納し、この値 を待っているスレッドをすべて目覚めさせ、状態遷移プ ロシージャに対するテイル・リカーシブ・コールに、ラ ンすべき新しいスレッドを選択させる。 Et はダイナミ ック・ワインド・フォーム内に包まれているので、スレ ッドが異常終了した場合でも、スレッドの記憶領域がガ ーベッジ・コレクションされることが保証される。

【0127】ガーベッジ・コレクションは、スレッドの ウエイターが起される前に行われなければならない。そ れは、スレッド(スレッドのサンクが復帰させたオブジェクトを含む)より長生きであって、ローカル・ヒーブ を含んでいたオブジェクトは他の活性ヒーブに移転させ 必必要があるためである。これが行われないと、他のス レッドが、新たに終了したスレッドの記憶領域に対する 参照を得ることになるからである。確定したスレッドの 記憶領域は他のスレッドに割り当てられるので、これは 明らかにエラーとなる。

(0128] ベスレッド・ボリシー・マネージャ>各仮想プロセッサはスレッド・ボリシー・マネージャを行いる。スレッド・ボリシー・マネージャは、仮想プロセッサ上でのスレッドのスケジューリングおよび移行に関するすべてのボリシーの決定を行う。スレッド・コントローラはスレッド・リンーマネージャの依頼者であり、ユーザのコードはそれをアクセスできない。スレッド・コントローラは、次のことに関連して決定を行うな要がある場合には必ずスレッド・ボリシー・マネージを要がある場合には必ずスレッド・ボリシー・マネージャをコールする。すなわち、スレッドの仮想プロセッサをコールする。すなわち、スレッドの仮想プロセッサをコールする。すなわち、スレッドの仮想プロセッサをコールする。すなわち、スレッドの仮想プロセッサ

への初期マッピングと、現在のスレッドがなんらかの理由で仮想プロセッサを解放したとき、次に仮想プロセッサはどのスレッドをランさせるがきかということと、いつ、どのスレッドを仮想プロセッサに、あるいは仮想プロセッサから移転させるかということである。

[0129] すべての仮想プロセッサは同一のスレッド ・コントローラを有しているが、各仮想プロセッサは異 なるポリシー・マネージャを備えることができる。この ことは、各プロセッサが、必要なスケジューリングがな まざまに異なるサプシステムを制御するというリアル イム・アプリケーションにとって特に重要である。

【0130】スレッド・ポリシー・マネージャはスレッド・コントローラに対してよく定義されたインターフェースを提供する。スレッド・ポリシー・マネージャが決定を行うために用いるデータ構造は、スレッド・ポリシー・マネージャにとって完全にブライベートなものとなっている。それらは特定のスレッド・ポリシー・マネージャに対してローカルとしたり、あるいは種々のスレッド・ポリンー・マネージャが共有するようにできない、それらの組み合せとすることもできる。して、スレッド・ポリシー・マネージャは、異なる仮想マンンに対して異なる振舞を行うようにカスタマイズすることができる。その結果、ユーザは、ランさせるプログラムの種類に応じてポリシーの決定をカスタマイズすることができる。その結果、ユーザは、ランさせるプログラムの種類に応じてポリシーの決定をカスタマイズすることができる。

[0131] V Pはそれぞれ異なるスレッド・ボリシー・マネージャを備えることができるので、アブリケーションによって生成された異なるグループのスレッドは、異なるスケジューリング方式の対象とすることができる。仮想マシンあるいは仮想プロセッサは異なるスケジューリング・プロトコルあるいは異なるスケジューリング・ボリシーを扱うよう課度することができる。

【0132】スティングのスレッド・コントローラは、 スレッドの状態遷移プロシージャを定義するが、先験的 なスケジューリング・ポリシーあるいは先験的な負荷平 衛・ポリシーは定義しない。これらのポリシーはアプリ ケーションに依存する場合がある。いくつかのデフォル ト・ポリシーがスティングの企実行時間環境の一部とし て与えられるが、ユーザは自身のポリシーを自由に書く ことができる。事実、図3に示すように、各仮想プロセ ッサ16はそれ自身のスレッド・ポリシー・マネージャ (TPM) 19を有している。従って、与えられた仮想。 TPM19はスレッドのスケジューリング、プロセッサ / スレッドのマッピング、ならびにスレッドの移行を扱 う。

【0133】 アブリケーションを個別のスケジューリング・グループに分けられるということは、長寿型の並列(あるいは会話型)ブログラムにとって重要である。

/Oに関連したプロシージャを実行するスレッドは、計 算に関連したルーチンを実行するスレッドとは異なるス ケジューリングを必要とする。リアルタイムの制約を持 つアブリケーションは、単純なFIFOスケジューリン グ・ボリシーのみを必要とするものとは異なるスケジュ ーリング・プロトコルを用いて実現されるべきである。 【0134】ツリー構造の並列プログラムは、LIFO にもとづくスケジューラを用いることによって、もっと も良好に動作しよう。マスタ/スレーブ・アルゴリズム あるいはワーカー・ファーム・アルゴリズムをランさせ るアプリケーションは、公正さのためにラウンド・ロビ ン・プリエンプション・スケジューラを用いることによ って、より良好に動作しよう。これらのアプリケーショ ンはすべて、大きいプログラム構造体あるいは大きいプ ログラム環境の構成要素であるから、これらのアプリケ ーションを異なるポリシー・マネージャによって評価す ることで得られる季軟性は重要である。間一の仮規マシ ン上で評価するスレッドの集まりを独立に実行する、個 別のアプリケーションは存在し得る。さらに、各個別の スケジューラは、異なる性能特性を有し、そして異なる 形で実現されたスレッド・ポリシー・マネージャを有す ることができる。

【0135】本発明は、柔軟なフレームワークの提供を探究するものである。そしてこの柔軟なフレームワークは、スレッド・コントローラ自身に対する変更を行うことなく、ユーザに対して明らかに異なるスケジューリング方式を組み入れることができるものである。そのため、すべてのTP Mは、その実現において制別は一切はならない。以下に示すインターフェースに従わなければならない。以下に示すインターフェースは、ランすべき新しいスレッドを遺択し、評価中のスレッドを待ち行列に挿入し、スレッドの侵患順位を設定し、そしてスレッドを移行させるためのオペレーションを提供する。これらのブロシージャはTCが排他的に用いるためのもののある。一般に、ユーザ・アブリケーションは、スレッド・ボリシー・マネージャとスレッド・コントローラとのインターフェースを承知している必要はない。

【0136】(tpm-get-next-thread vp)は次にvp上でランすべきレディー状態のスレッドを戻す。

【0137】 (tpm-enqueue-readythread vp obj) は、スレッドあるいはT CBのいずれかであろうobjをvpに関連するTPM のレディー待ち行列に挿入する。

[0138] (tpm-priority prior ity) および (tmp-quantum quant um) は、それぞれの引数が有効な優先順位か、あるい は有効なクオンタムかを確認するガードプロシージャで ある。

[0139] (tpm-allocate-vp th

read)はthreadをvpに割り当てる。vpが 偽の場合には、threadはTPMによって確定され る仮想プロセッサに割り当てられる。

【0140】(tmp-vp-idle vp)は、v p上に評価を行っているスレッドが無い場合、スレッド・マネージャによってコールされる。このプロシージャ はスレッドを他の仮想プロセッサから移行させたり、簿 記を行ったり、他のVPに対するプロセッサ・スイッチ 自身を持つために物理的プロセッサをコールしたりする ことができる。

【0141】(tpm-enqueue-suspend up-thread)は、vpの保留待ち行列上のthreadを保留する。

[0142] TPMは、評価中のスレッドに対するスケ ジューリングの順序を決定する以外に、負荷平衡の2つ の基本的決定を行う。(1) 新しく生成されたスレッド を走らせるべきVPを選択する。(2) VP上のどのス レッドを移行できるかを決め、他のVPからどのスレッ ドを移行できるかを決める。

[0143]最初の決定は、初期の負荷平衡を扱うため に重要である。第2の決定は、動的負荷平衡・プロトコ ルをサポートするために重要である。新しく評価中のス レッドの最初の配置の決定は、しばしば現在評価中のス レッドの移行を決めるために用いられる優先順位とは異 なる優先順位にもとづいて行われる。TPMインターフ ェースはこの区別を保存する。

【0144】スケジューリング・ポリシーはいくつかの 重要な事柄に従って分類できる。

【0145】ローカリティ:このシステム内に単一のグローパル待ち行列があるか、あるいは各TPMはそれ自身の待ち行列を持っているか?

状態:スレッドはそれらの現在の状態にもとづいて区別 されているか・例えば、あるアプリケーションは、すべ てのスレッドが、それらの現在の状態に関係無く単一の 待ち行列を占めるという実則法を選択するかもしれな い。あるいは、スレッドが影冊中か、スケジュールされ たが、保留されているかなどにもとづいて、スレッドを 異なる待ち行列に分類することを選択するかもしれな い。

【0146】順序付け:待ち行列は、FIFO、LIFO、ラウンド・ロビン、優先順位、あるいはリアルタイムの構造体として(他のものの中で)実現されているか

慮列化:アブリケーションはどのようなロッキング構造 を種々のポリシー・マネージャの待ち行列に課すか。

【0147】この分類でどの選択肢を選ぶかによって、 結果としての性能特性に差が生じる。例えば、評価中の スレッド (すなわち、TCBを有するスレッド) をスケ ジュールされたスレッドから区別するグラニュラリティ 構造体を適合させ、そしてスケジュールされたスレッド のみを移行させることができるという制約を課した場 合、評価中のスレッドの待ち行列をアクセスするのにロ ックは不要となる。この待ち行列は、それが生成された VPに対してローカルである。しかし、スケジュールさ れたスレッドを保持している待ち行列は、他のVP上の TPMによる移行のターゲットであるから、ロックされ なければならない。この種のスケジューリング方式は、 動的負荷平衡が問題ではない場合には、有用である。従 って、多数の長寿命の、非ブロッキング・スレッド(継 続時間はほぼ同じ)が存在するときは、ほとんどのVP は、それら自身のローカル・レディー待ち行列上のスレ ッドの実行に、ほとんどの時間、ビジーとなる。従っ て、このようなアプリケーションにおけるこの待ち行列 上のロックを除去することは有益である。一方、継続時 間が変動するスレッドを発生するアプリケーションは、 スケジュールされたスレッドおよび評価中のスレッドの 両方の移行が可能な TPMと共に用いたとき、ラン可能 なレディー待ち行列をロックすることに伴ってコストが かかるが、より高いパフォーマンスを示す。

【0148】 スレッド・ポリシー・マネージャが新しい スレッドを実行する必要があるときは常に、グローバル 待ち行列はスレッド・ポリシー・マネージャ間の競合を 意味する。しかし、このような仕組にすると、多くの並 列アルゴリズムの実現において有用である。例えば、マ スタ/スレーブ(あるいはワーカー・ファーム)プログ ラムでは、マスタに最初にスレッドのブールを生成す る。これらのスレッドは、それら自身はいかなる新しい スレッドも生まない、長寿命の構造体である。これらは 一度VP上でランすれば、滅多にブロックすることはな い。従って、このようなスレッドを実行しているTPM は、ローカル・スレッド待ち行列を維持することのオー バーヘッドをサポートする必要はない。しかし、ローカ ル待ち行列は、プロセスの構造がツリーあるいはグラフ の形をとる結果、並列プログラムの実現においては有用 である。これらの待ち行列は、仮想プロセッサの組にお いて公正にスレッドをロード・バランスするために、こ のようなアプリケーションで用いることができる。

[0149] ベメッセージ伝達抽象体ンメッセージ伝達 は分離メモリ・アーキテクチャにおいて効率の良い通信 メカニズムでなければならない。特に、グラニュラリティの相い並列アブリケーション、あるいは既知の通信パ ターンを有する並列アブリケーションに対してそうであ 。ボートは、分離メモリ・アーキテクチャ上で共有メ モリを実現することのオーバーヘッドを最少限のものと するためにスティング内に設けられたデータ抽象体であ る。ファーストクラスのアコシージャおよびボートは、 このコンテクストにおいて共同作業を示す。

【0150】スティングは、メッセージ伝递抽象体を共 有メモリ環境において統合することを可能とする。ポー トはファーストクラスのデータ・オブジェクトであり、 他のスレッドから送られるメッセージに対するレセブタ クルとして働く。スティングは共有仮想メモリ・モデル を用いるので、いかなる複合データ構造 (間包を含む) でもボートを通じてやり取りできる。この柔軟性のた め、スティングのアプリケーションはユーザ・レベルの メッセージ伝達プロトコルを明瞭な形で実現でき、そし て単一化した環境において共有メモリとメッセージ伝達 の最も優れた長所を結合することが可能となる。

- 【0151】ポートはファーストクラスのデータ構造で ある。ポートに対しては2つの基本的オペレーションが ある。
- 【0152】1. (put obj port) は、objをportにコピーする。この操作は送り手と非同期である。
- 【0153】2. (get port)は、port内の最初のメッセージを除去し、portが空の場合にはブロックする。
- 【0154】ポートPから読み出したオブジェクトは、 Pに書き込まれたオブジェクトのコピーである。このコ ピーは洩いコピーである。すなわち、オブジェクトの最 上位の構造体のみがコピーされており、下位の構造体は

```
(define (receiver port)
  (let ( (msg (get port) ) )
     (fork-thread (msg) (current-vp) )
     (receiver) ) )
```

送出されたプロシージャはこのレシーバの仮想プロセッ サ上で評価される。レシーバは、メッセージを評価する ために新しいスレッドを生成することによって、古いリ クエストの処理と並行して新しいリクエストを受け入れ ることができる。

【0157】このスタイルの通信は"アクティブ・メッ セージ"と呼ばれている。それは、メッセージを受け取 ったとき行うべき動作が、基本のシステムの一部として コード化されておらず、メッセージそれ自身によって決 められているからである。仮想プロセッサとスレッドの インターフェースは、メッセージ通信をサポートするた めにいかなる変更も必要としないので、このようなモデ ルによって極めて大きい柔軟性と単純性が得られる。ス ティングの設計における2つのことが、この機能の実現 にとって重要である。(1)オブジェクトが共有仮想メ モリに存在するため、すべてのオブジェクト(他のオブ ジェクトに対するレファランスを有しているオブジェク ト、例えば閉包を含む) は仮想プロセッサ間で自由に送 信できる。(2)ファーストクラスのプロシージャは、 ユーザが定義する複雑なメッセージ・ハンドラーの構築 を可能とする。これらのハンドラーはいずれかの仮想プ ロセッサ上の分離したスレッド内で実行できる。分離メ モリ・マシンでは、オブジェクトは分散共有仮想メモリ に存在することになろう。説明のため、上述の例で、E をデータベースの複雑な問い合わせとする。このデータ 共有されている。これらのボートは、共有メモリが不十 分な場合に用いるよう設計されているので、意味規則を コピーすることで設計されている。put の類準(イジ ョンはシャローコピーを行うが、ディープコピーを行う バージョンもある。そのバージョンは、最上位のオブジ エクトをコピーするだけでなく、下位の構造体もすべて コピーする。

【0155】例えば、浅いコピーを用いてメッセージ内 の間包を送る場合、関包のコピーを構築する。しかし、 関包が定義する環境内で乗むられたオブジェクトへの参 照は保存する。使用するコピー・メカニズムの選択は、 明らかに脅後の地理的アーエテクチャとアフリケーショ ンの分野の影響を受ける。スティング実現が存在する特 定の物理的サブストレートに適合させることのできる一 連のメッセージで低速実財が存在する。

【0156】従って、つぎの表現の評価により、

(put (lambda () E) port)

プロシージャ (lambda () E) の閉包がport へ送出される。port上でレシーパが次のように定義 されているなら、

ベースが存在するプロセッサ上でレシーバが例示された とすると、このような間い合わせは、データベース自身 の、コストのかかる移行を伴わない。間い合わせは、デ ータベースが存在するプロセッサに直接コピーされるの で、通信のコストが低減される。データベースそれ自身 は問い合わせを実行するプロセッサに移行する必要が か、より伝統的なRPCスタイルの通信ではなくデータ にプロシージャを送るという能力により、いくつかの点 で重要なパフォーマンスおよび表現性の向上が得られる 可能性がある。

【0158】ファーストクラスのプロシージャおよびうイトウエイトのスレッドは、アクティブ・メッセージに おいて、魅力的な高レベルの通信抽象体を応達する。これらの油像体を利用せずにアクティブ・メッセージをサポートするシステムでは、この機能は典型的には低レベル・サポート・プロトコルによって実現される。ファーストクラスのプロシージャはボクティブ・メッセージを平凡に実現することを可能とする。アクティブ・メッセージはボートに送られるプロシージャである。ファーストクラスのボートは分散計算環境においても明確で重要な効用を有し、そして従来のPRCより簡単で、かつ清潔なプログラミング・モデルの実現を可能とする。

【0159】 <メモリ管理>スティングは共有仮想メモリ・モデルを用いる。分散メモリ・ブラットフォーム上ではスティングは分散共有仮想メモリ・サブストレート

上で構築されなければならない。従って、参照の意味 は、参照がどこで発生されているか、あるいはオブジェ クトが物理的にどこにあるか、には依存しない。

[0 16 0] <記憶機構>スティングでは各TCB32 に関連して3つの記憶領域がある(図5)。第1はスタック31であり、スレッドによって生成されたオブジェクトの別リ当でに用いられる。このスレッドの寿命は、たれを生成したものの動的な範囲を越えない。より正確には、スタック上に割り当てられたオブジェクトは、現在の(あるいは前の)スタック・フレームに割り当でられた他のオブジェクトしか参照できない。スタックが割り当てられたオブジェクトした一つ内のオブジェクトを参照することができる。なせなら、そのスタックに関連するスレッドは、ヒーブ33がガーペッジ・コレクションされる間、保留となるからである。スタックに含まれている参照情報は、ガーペッジ・コレクタによってトレースしたとされるルトの一部である。

【0161】スレッドにとってプライベートなヒープ、 すなわちローカル・ヒープ33は、割り当てられた非共 有オブジェクトに対して用いられる。このオブジェクト は、その寿命が、オブジェクトを生成したブロシージャ の寿命を越える可能性がある。越える可能性があるとし たのは、スキームやMLなどのプログラミング言語では コンパイラがオブジェクトの寿命を常に決めることがで きるとは限らないからである。さらに、未知のプロシー ジャに対するコールが可能な言語においては、オブジェ クトの寿命が決められない場合もある。プライベート・ ヒープに含まれている参照情報は同じプライベート・ヒ ープ内の他のオブジェクト、あるいは共有ヒープ、すな わちグローバル・ヒープ35を示すことができるが、ス タック31内のオブジェクトを示すことはできない。こ のスタック内の参照情報はプライベート・ヒープ内のオ ブジェクトを示すことができるが、共有ヒープ内の参照 情報はこれらのオブジェクトを示せない。プライベート ・ヒーブに割り当てられたデータは、単一の、制御のス レッドによって排他的に用いられるので、ブライベート ・ヒープによってより高いローカリティが実現する。複 数のスレッド間にさしはさまれた割り当てがないという ことは、ヒーブ内で互いに接近したオブジェクトは、論 理的に互いに関連している可能性が高いことを意味す る。

[0162] 他のスレッドは、スレッドのスタックある いはローカル・ヒーブ内に含まれているオブジェクトを アクセスできない。従って、スレッドのスタックおよび ローカル・ヒーブは共に、同期化あるいはメモリのコセ ーレンシーを考慮することなく、ブロセッサとのローカ ル・メモリにおいて実現することができる。スレッドの ローカル・ヒーブは実際には、世代的に組織した一連の レーブである。記憶領域の別り当ては常に、他の世代的 コレクタと同様に、最も若い世代において行われる。オ ブジェクトは、年齢が高くなるにつれて、古い世代に移 動される。ローカル・ヒープのガーベッジ・コレクショ ンはすべてスレッドそれ自身によって行われる。ガーベ ッジ・コレクションをサポートするほとんどのスレッド ・システムでは、システム内のスレッドはすべて、ガー ベッジ・コレクションの間は保留されなければならな い。それに対して、スティングのスレッドは、他のスレ ッドと独立して、そして非同期的にそれらのローカル・ ヒープをガーベッジ・コレクションする。従って、他の スレッドは、特定のスレッドがそのローカル・ヒープを コレクションしている間、計算を続けることができる。 その結果、より優れた負荷平衡と高いスループットが得 られる。このガーベッジ・コレクションのストラテジィ の第2の長所は、ローカル・ヒープのガーベッジ・コレ クションにかかるコストが、システム内のすべてのスレ ッドに課されるのではなく、記憶領域を割り当てるスレ ッドにのみ課されるという点にある。

【0163】 スティングは、関連するスレッドの集まりを制御するための手段として "スレッド・グループ"を あえる。子のスレッドは、それが新しいグループの一部 として生成されたのでない限り、その親と同一のグループに属する。スレッド・グループは、デバッグおよびモニタのためかオペレーション (例えば、与えられたグループ内のすべてのスレッドのリストアップ、すべてのグループのリストアップ、プロファイリング、系統の報告 など) と共に、漢常のスレッドのオペレーシス (例えば、終了、保留など) を与える。さらに、スレッド・グループはまた、そのメンバーがすべてアクセスできる "共和ヒープ"を含べている。

【0164】 スレッド・グループの共有ヒーブ、すなわ ちグローバル・ヒーブ35は、スレッド・グループが生 成されたとき割り当てられる。ローカル・ヒープのよう な共有ヒーブは実際には、世代的に組織された一連のヒ ープである。共有ヒープ内の参照情報は共有ヒープ内の オブジェクトしか示せない。これは、共有オブジェクト から参照されるオブジェクトはすべて共有オブジェクト であり、従って、共有ヒープ内に存在しなければならな いからである。この共有ヒープに対する制約は、(a) 共有ヒーブ内にあるか、あるいは(b)ローカル・ヒー プ内に割り当てられていて、共有ヒーブ内にガーベッジ ・コレクションされているオブジェクトを、共有ヒープ に記憶された参照情報が指示することを保証することに よって、実施される。すなわち、参照されたオブジェク トから到達可能なオブジェクトのグラフは、共有ヒープ 内にコピー、または配置されなければならない。このメ モリ・モデルのオーバーヘッドは、ローカル・ヒープ上 に割り当てられたオブジェクトに対する参照情報がどれ くらい頻繁にエスケープするかによって決まる。経験に よれば、ファイン・グレインド並列プログラムを実現す る場合、ローカル・ヒーブに割り当てられたオブジェクトはほとんど、関連するスレッドに対してローカルであり続け、共有されない。スレッド間で頻繁に共有されるオブジェクトは、言語抽象体あるいはコンバイル時の分析によって容易に検出される。

【0165】要約すると、あるスレッドに関連するスレッド領域間の参照規律は次のようになる。すなわち、

(1) スタック内の参照情報は、その現在のあるいは以前のスタック・フレーム、またはローカル・ヒーブ、または共有ヒーブ内のオブジェクトを示し、(2)ローカル・ヒーブ内の参照情報は、そのヒーブ上のオブジェクトあるいはなんらかの共有ヒーブに割り当てられたオブジェクトを示し、そして(3)共有ヒーブ内の参照情報は、その共有ヒーブ(あるいは、他のなんらかの共有ヒーブ)に割り当でられたオブジェクトを示す。

【0166】ローカル・ヒーブのように、グローバル・ ヒーブは単代的に組織されているが、グローバル・ヒー ブのガーベッジ・コレクションは、ローカル・ヒーブに 対するものより複雑である。それは、多数の異なるスレッドが、グローバル・ヒーブのカブジェクトを同時に アクセスする場合があるからである。なお、その結果、 グローバル・ヒーブの割り当てにはヒーブのロックが必要である。

【0167】グローバル・ヒーブをガーベッジ・コレク ションするために、関連するスレッド・グループ内のす ベでのスレッド(そして、その下位のもの)は保留され る。それは、これらのスレッドはすべてグローバル・ヒ ーブ内のデータをアクセスできるからである。しかし、 システム内の他のスレッド、すなわち、ガーベッジ・コ レクションされるヒーブに関連するグループ内にないも のは、ガーベッジ・コレクションと無関係に実行を継続 する。

[0168] 各グローバル・ヒーブは、それに関連し、 そこに到来する参照情報を有している。これらの組は、 は城境界を相等する参照情報の記憶に対するチェックに よって、維持される。グローバル・ヒーブに関連するス レッドが保留された後、ガーベッジ・コレクタは到来参 服情報の組をガーベッジ・コレクションのためのルート として用いる。到来参照情報の組から到遠できるオブジ ェクトはすべて新しいヒーブにコピーされる。ガーベッ ジ・コレクションが終了すると、グローバル・ヒーブに 関連したスレッドは再聞される。

【0169】 <抽象物理的マシンおよび抽象物理的プロセッサ> このオベレーティング・システムの最も低レベルの抽象体は、抽象物理的マシン(APM)と呼ばれるマイクロ・カーネルである。

【0170】APMはスティング・ソフトウエア・アー キテクチャにおいて3つの重要な役割を果たす。

【0171】1、複数の仮想マシンをサポートする安全 で効率的な基礎を提供する。 【0172】2.システム内の他のすべての要素を、ハードウエアに依存する特徴および特異性から分離する。 【0173】3.システムの物理的ハードウエアに対するアクセスを制御する。

【0174】APMはルート仮想マシンと呼ばれる特別 の仮想マシン内で実現される。このマシンは、仮想アド レス空間、仮想プロセッサ、ならびにスレッドを含む、 他のいずれの仮想マシンでも利用できる機能に対するア クセス手段を有している。さらに、ルート仮想マシン は、抽象物理的プロセッサ、デバイス・ドライバ、なら びに仮想メモリ・マネージャに対するアクセス手段を有 している。抽象物理的マシンは仮想マシンによって構成 されており、その結果、いくつかの重要な表現性が得ら れる。ヘビーウエイトのスレッドは一切無い。すべての スレッドはライトウエイトである。システム・コールを 実現するカーネル・スレッドあるいはスタックは無い。 すべてのシステム・コールは、システム・コールを作成 するスレッドの実行コンテクストを用いて扱われる。こ のことは、スキームが安全な言語であり(すなわち、ダ ングリング・ボインタ、アドレスとデータ間の自由強制 などは不可能である)、そしてAPMの部分はシステム 内のすべての仮想マシンにマッピングされているため、 可能となっている。ユーザのスレッドが利用できる非問 期のプログラミング構築体は、APM内のスレッドも利 用できる。APMに関連したスレッドは、仮想マシン内 の他のすべてのスレッドと間様に制御することができ る。カーネル操作の実行をブロックするスレッドは、そ のことを、それらスレッドの仮想プロセッサに通知す る。それによってVPは他のなんらかのスレッドを自由 に実行できる。これはスレッド間の通信および 1/0の 両方の場合に行われる。スティングは、例えば、スケジ ューラの起動、あるいはPsvcheの仮想プロセッサ 抽象体と同じ能力を提供するように、非ブロッキング・ カーネル・コールを処理する。

【0175】仮想マシンはAPMによって生成され、そして破壊される。新しい仮想マシンの生成には以下のことが伴う。

【0176】1. 新しい仮想アドレス空間を生成する。 【0177】2. このアドレス空間にAPMカーネルをマッピングする。

【0178】3. この仮想マッピング内にルート仮想プロセッサを生成する。

【0179】4. このマッピングに抽象物理的プロセッサを割り当てる。

【0180】5. 抽象物理的プロセッサ上でランさせる ために上記ルート仮想プロセッサをスケジュールする。 【0181】仮想マシンの破壊には、そのマシン上でラ ンしているすべてのスレッドを終了させるための信号を 発生し、マシン内で実行しているスレッドがオーブンし たデバイスをすべてクローズし、そして最後に、このマ シンに関連する仮想アドレス空間の割り当てを解除する ことが伴う。

【0182】名プロセッサ抽象体12は仮想プロセッサ・ボリシー・マネージャ(VPC)13と仮想プロセッサ・ボリシー・マネージャ(VPPM)15から成る。VPコントローラとVPボリシー・マネージャとの関係は、スレッド・コントローラはとフトリー・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・マネージャン・オリン・マネージャン・マネージャをコールする。

[0183] 物理的プロセッサはすべて同一のVPコントローラをランさせるが、それらは異なるVPポリシーマネージャをランさせることができる。その結果、マルチプロセッサ・システムはシステムによる各物理的プロセッサの利用をカスタマイズすることが可能となる。 また、システムは各物理的プロセッサ上で同じVPボリシー・マネージャをランさせることも可能である。

[0 1 8 4] 仮想マシンが抽象物理的プロセッサ上の仮 超プロセッサをスケジュールしようとする場合、仮型マ シンはその物理的プロセッサ上の仮想プロセッサ・コントローラをコールする。同様に、仮想マシンが、抽象物 理的プロセッサから仮想プロセッサを除去しようとする 場合には、仮想マシンはその物理的プロセッサ上の仮想 プロセッサ・コントローラをコールする。各VPコント ローラは、仮想プロセッサの状態変化を含め、その物理 的プロセッサにマッピングされた仮想プロセッサを管理 する。

【0185】 V P ポリシー・マネージャは、物理のプロセッサ上の仮想プロセッサのスケジューリングおよび移行に係わるすべてのポリシーの決定を行う。この決定には3つのタイプがある。第1に、V P ポリシー・マネージャはV P から P Pへのマッピングを決める。このマッピングは2つの異なるタイミングで行われる。すなわち、V P が最初にランされたときと、プロックされていたV P が再びランされたときである。第2に、ポリシー・マネージャは、N P ボリシー・マネージャは、いつV P をあるプロセッサから他のプロセッサに移動(移行)させるべきかを決める。

【0186】 これらの3つの決定によって、VPボリシ・マネージャはマシン上のワーク・ロードのバランスをとることができ、そして仮想マシンに関する物理的マシンの公正せに係わる性質を決めることができる。また、物理的ブロセッサが故障したとき、故障許容VMのVPをどこに移動させるかを決めることができる。

【0187】スレッド・ポリシー・マネージャのように VPはVPコントローラに対して良く定義されたインタ ーフェースを提供する。VPポリシー・マネージャがそ の決定を行うために用いるアータ構造はVPボリシーマネージャに対して完全にフライベートである。これらのデータ構造は特定のVPボリシー・マネージャに対してローカルとできるか、またはVPボリシー・マネージャの種々の場合において共有できるか、またはそれらの組み合せとできる。しかし、システムの他の要素はそれらに対するアウセス手段を持たない。VPボリシー・マネージャは、スティングの異なる場合に対して異なる機能により、スティングを、リアルタイム・システムや、会話型システムや、多量の計算を行うシステムなど、さまざまなオペレーティング・シストは現境に対して、カスタマイズすることが可能となる。

[0188] 最後に、スレッド・ポリシー・マネージャはスレッド間の負荷平衡および公正さに係わっているが、仮想プロセッサ・ポリシー・マネージャは、仮想マシン間および仮想プロセッサ間の負荷平衡および公正さに係わっている。

【0189】APM内の各物理的プロセッサは、仮想プ ロセッサ・コントローラ(VPC)と仮想プロセッサ・ ポリシー・マネージャ (VPPM) を含んでいる。この 点で、物理的プロセッサは構造的に仮想プロセッサと同 一である。VPCは仮想プロセッサ上の状態変化に影響 を与える。スレッドのように、仮想プロセッサはラン、 レディー、ブロック、あるいは終了のいずれかの状態を とり得る。ラン状態のVPは物理的プロセッサ上で現在 実行されている。レディー状態のVPはランすることが 可能であるが、現在はランしていない。ブロック状態の VPは、なんらかの外部イベント(例えば I/O)を待 っているスレッドを実行している。VPPMは物理的プ ロセッサ上のVPのスケジューリングを行う。そのスケ ジューリング・ボリシーはTPMが用いるものと同様で ある。VPPMは良く定義されたインターフェースをV Pコントローラに対して提供する。異なるスティングの システムは異なるVPボリシー・マネージャを備えるこ とができる。

【0 1 9 0】 < 例外の扱い>同期した例外および割込は、 スティングでは一様に扱われる。すべての例外には、例外を扱うための1組の動作を実行するハンドラーが関連 している。ハンドラーはスレッド内で実行するアロシーシャである。プロセッサP上で生じた例外は、Pの現在 のスレッドのコンテクストを用いて実行する。スティン グのマイクロ・カーネル内には特別の例外スタックは無 い。プロセッサP上である例外(例えば、無の命令、メ モリ保護破壊など)が生じた場合、Pの現在のコンティ ニュエーション(すなわち、プログラム・カウンタ、ヒ ーブ・プロンティア、スタックなど)がまず温費され る。次に例外ディスパッチャーは例外のターゲットを見 つけるため、スレッドがランしている場合にはそれを中 断し、そしてンドラーのコンティニュエーションおよ び引数をターゲット・スレッドのスタックトにブッシュ する。次に、ディスパッチャーは(a)現在のスレッド を、単純にそれに復帰させることによって再開させる か、(b) ターゲット・スレッドを再開させるか、ある いは (c) このプロセッサ上の他のいずれかのスレッド を再開させるためにスレッド・コントローラをコールす るか、いずれかを選択する。ターゲット・スレッドが再 開された場合には、そのスレッドはそのスタックの最も Fのコンティニュエーションを実行する。これは例外ハ ンドラーのコンティニュエーションである。

【0191】スティングにおけるこの例外処理手段はい くつかの点で優れている。

【0192】1、この例外処理手段はプロシージャであ るため、単にそれをコールするだけで例外を扱える。 【0193】2、例外は、実行コンテクストを受け取る スレッドの実行コンテクストにおいて扱われる。

【0194】3、例外は現在のスレッドのコンテクスト においてディスパッチされる。

【0195】4、一度ディスパッチされた例外はターゲ ット・スレッドの現在のコンティニュエーションとな り、そしてスレッドが再開されたとき自動的に実行され る。

【0196】5、例外はターゲット・スレッドが再開さ れたときのみ扱われる。

【0197】6. 例外を扱うコードはスキームによっれ 書かれ、そしてそのコードはコンティニュエーションと プロシージャを操作して所望の効果を達成する。

【0198】ファーストクラスのブロシージャとスレッ ド、明白なコンティニュエーション、動的な記憶領域の 割り当て、ならびに均一なアドレシング・メカニズムは すべてスティングの設計の中心的な特徴であり、その結 果、スティングはこの例外のモデルを与えることが可能 となっている。

【0199】問期した例外のターゲット・スレッドは常 に現在のスレッドである。非同期の例外、すなわち割り 込みはわずかに異なる形で扱われる。割り込みはどのス レッド(現在実行中のスレッドではない)でも制御でき るので、このような例外を扱うためには、ハンドラー は、例外を直接処理するか、すなわち現在ランしている スレッドを中断して例外を扱うか、あるいは新しいハン ドラーを生成する必要がある。割込ハンドラーもスキー ムのプロシージャであるため、ハンドラーを実行するた めにスレッドを確立するか、あるいは現在のスレッドを 用いる場合、単に適当なスレッドの現在のコンティニュ エーションを、ハンドラーをコールするように設定すれ ばよい。スティングの例外ディスパッチャーのための疑 似コードを以下に示す。

[0200]

```
1: (define (exception-dispatchertype.
args)
 2:
      (save-current-continuation)
 3:
      (let ((target handler (get-target
&handler type args)))
 4:
      (cond ( (eq?target (current-thread
))
 5:
             (apply handler args))
 6:
           (else
 7:
              (signal target handler a
rqs)
 8:
              (case ((exception-priorit
y type))
 9:
                ((continue) (return))
                ((immediate) (switch-to
-thread target))
 11:
                ((reschedule) (vield-pr
ocessor)))))))
```

ライン2では、現在のコンティニュエーションが現在の スレッドのスタックに退避される。このコンティニュエ ーションは、エスケーブできず、そして一度だけコール されるので、上記スタックに上記コンティニュエーショ ンを退避できる。ライン3では、ディスパッチャーが、 例外の対象となるスレッドと、例外のタイプに対するハ ンドラーとを見つける。ライン4では、例外のターゲッ トが現在のスレッドであるかどうかがチェックされ、そ

うなら、例外コンティニュエーションはプッシュされな い (ライン5)。ディスパッチャーはハンドラーをむし ろ単純にその引数に適用する。ディスパッチャーはすで に例外ターゲット (すなわち現在のスレッド) のコンテ クストで走っているので、このことが有効である。例外 のターゲットが現在のスレッドでない場合には、ディス パッチャーは例外をターゲット・スレッドに送る(ライ ン7)。スレッドに信号を送ることはスレッドを中断

し、信号ハンドラーとその引数とを含むコンティニュエーションをスレッドのスタックにブッシュすること、そして信号ハンドラーが実行されるようにするスレッドを 再期させることと等価である。ターゲット・スレッドに信号を送った後、ハンドラーはブロセッサ上で次にどのスレッドを走らせるかを決める(ライン8)。走らせるのはそれ自身の場合もあり(ライン9)。あるいはターゲット・スレッド(ライン10)か、または最も優先順位の高いスレッドの場合もある(ライン11)。

【0201】スティングの例外ハンドリング機能と他の オペレーティング・システムにおけるものとは、もう1 つ重要な点で異なっている。例外を扱うスレッドは、シ ステム内のユーザ・レベルのスレッドと違わないので (例えば、それらは自身のスタックとヒープを持ってい る)、また、例外ハンドラーは通常のファーストクラス のプロシージャであるため、ハンドラーは記憶領域を自 由に割り当てることができる。ハンドラーによって生成 されたデータは、他のデータが復元されるのと間じ方法 で、ガーベッジ・コレクタによってリクレームされよ う。例外ハンドリングのメカニズムと、より高レベルの スティングの抽象体との間の均一性のため、デバイス・ ドライバを実現したとき、高い表現性および高い効率が 得られる。このことは、上記均一性が無い場合には、並 列書語あるいは並列オペレーティング・システムにおい て実現しない。

【0202】ファーストクラスのブロシージャとスレッド、明白なコンティニュエーション、動的な記憶領域の 割り当て、ならびに均一なアドレシング・メカニズムが すべてスティングの設計の特徴であるため、スティング はこの例外のモデルを与えることができる。

【0203】 <並行パラダイム>以上、ソフトウエア・ アーキテクチャについて詳しく説明したが、以下におい てはいくつかの広範は並行パラダイムについて説明し、 本発明のソフトウエア・アーキテクチャによってそれを 実現する。

【0204】結果としての並行プログラムでは、並行して実行する各プロセスは、複合データ構造(例えば、アレーあるいはリスト)の値に影響を与える。または各プロセスは複合プロセスのグラフのメンバーである。プロセスの通信はこの結果の構造体またはグラフによる。そのcontributionである結果の要素にアクセスを組みる表現は、プログラムが定行プロックする。フューチャーは、結果としての並行プルゴリズムを実施するのに非常に適したオペレーションの良い例である。MultiにLispbカト(フューチャーと)は、計算Eのためのスレッドを生成する。そしてリターンされたオブジェクトはフューチャーとして知られている。結果として、を生じてEが終了したとき、フューチャーが確定したと言う。フューチャープロとは、カス・フィーチャーとしてアーターのよりは、大きなアーターを生じてEが終了したとき、フェーチャーが確定したと言う。フューチーでは、対したとき、フェーチャージョンのよりが発生しているものよりないました。

ャーにタッチする表現は、Eがまだ計算されている場合 にはブロックし、他方、フューチャーが確立した場合に はVを与える。

【0205】図11に示す素朴なソーティング・プログ うムでは、フューチャーの各例は新しいスレッドの生成 を伴う。この振舞は望ましいものではない。それは、ブ ロセス・ツリーのレベル!で計算を行うフューチャーは レベル!・11などにおいてその子に対して明らかなデータ依存性を有しているといった理由による。このプログ ラムにおいてデータ依存性があった場合。プロセッサお よび記憶整面の利用度が低下する結果となる。これは、 生成されたライトウエイトのプロセスの多くが、まだ未 評価のフューチャーのものとして他の値をリウエストよ るときプロッケする必要があるか、または、例えば、小 さい素数を計算するプロセスの場合、それらを生成する ために必要をコストに比べ、少量の計算を行うためである。

【0206】 スレッドの動的な状態は大きいオブジェクト(例えば、スタックおよびヒープ)から成るので、プロセスのプロッキングが頻繁に生じる場合、あるいいプロセスにグラニュラリティが小さすぎる場合、キャッシュおよびページのローカリティについては妥強する。

【0 2 0 7 】 タッチおよびフューチャーの意味規則は、他のフューチャー同にタッチするフューチャー下は、G がまだ確定していない場合。Gでブロックしなければならないということを命令する。TF およびTG をそれぞ ペレーションのランタイム・ダイナミックスは、TBが (a) 遅延またはスケジュールされたとき、(b) 評価しているとき、(c) または確定したときのいずれかの場合、TG に対するアクセスを伴う場合がある。最後のケースでは、これらのスレッド間で同かに子をまで、6、ケース (b) の場合、TF はTG が完了するまでブロックする必要がある。ケース (a) の場合、スティングでは重要な聴途化を行う。これについては以下に説明する。

【0208】 TFは、TG内に閉じ込められた閉包(E と呼ぶ)を、コンテクスト・スイッチをブロックし、強制するより、もしそれ自身のスタックトトープを用いて評価することができる。実際、スティングでは、E を通常のブロシージャとして扱い、Gのタッチを単純なでも、でき吸収すると言う。TFは、その他の場合には必然のにブロックするという点でこの最適化は正しい。TFの助のなコンテクストを用いてEを適用することによって、TFが動作するVPは、コンテクスト・スイッチを実行するというオーバーヘッドを負わない。また、TFのTCBが代りに用いられるので、TGに対してTCBを制り当てる必要がない。

【0209】この最適化は、コールしているスレッドが

必ずしもプロックする必要がない場合に用いられたとき、目立って異なった結果を導くのみとなる場合がある。例えば、Tg がTF によるスペキュラティブ・コールの要素であったとする。さらに、Tg は分岐するが、他のスペキュラティブ・スレッド(TH と呼ぶ)は分岐しないとする。吸収が無い場合には、Tg およびTH は共に別々のスレッド・コンテクストを生む。しかし、吸収がある場合には、Tg はTg を吸収することができ、そして、Tg がルーブするのでTF もルーブしよう。スレッドが吸収できるか、またはできない場合、ユーザはスレッドの状態をパラメータ化して、TCに通知することができる。スティンがよののインターフェース・プロシージャを提供する。

【0210】吸収のため、スティングはコンテクスト・スイッチィングのオーバーヘッドを低減させ、そしてブログラムにないてブロセスが互いに強いデータ依存性を示すとき、そのプログラムに対するプロセスのグラニュラリティを増大させる。もちろか、オペレーションを最も効果的なものにするため、スケジュールされたスレッドが吸収された状態になり得るよう、スレッドのグラニュラリティは十分に大きいものでなければならない。プロセスのグラニュラリティがかさする場合には、吸収しているスレッドがそれらの値を要求できる前に、プロセッサは吸収され得る可能性のあるスレッドの評価を開始しよう。

【0211】負荷にもとづくインライニングおよびレイ ジーなタスク生成は、他の並列Lispシステムに応用 された2つの他の同種の最適化である。負荷にもとづく インライニングでは、現在のシステムの負荷がある特定 のスレッシュホールドを越えた場合、スレッドはインラ イン(すなわち、吸収)される。この最適化では、プロ グラマの介入は不要であるだけでなく、ある種の条件の もとでは、本来終了するはずのプログラムがデッドロッ クあるいは長時間の停止状態になる場合がある。これは インライニングの決定が撤回できないからである。従っ てこの最適化では、タスクが、そのデータ依存性のため にある順序で評価される必要があるとき、それとは異な る特定の評価の順序をタスクに課す。スレッドの吸収 は、吸収されない場合にはスレッドがブロックするとき のみ、そしてデータの依存性が保証されているときのみ 生じるので、この問題の影響を受けない。

【0212】レイジーなタスクの生成は、負荷にもとづくインライニングに係わる多くの問題を解決する。レイジーなタスクの生成では、常にすべてのスレッドの評価がインラインされるが、しかしプロセッサがアイドル状態となったとき、このインライニング・オペレーションを撤回可能とする。スレッドは実際に必要とされない限リ決して生成されない、この設計ではプログラマの介入を必要とせず、本来デッドロックとないプログラムのデッドロックを招かず、そして、実際に発生されるタスク

の数が低減される。

【0213】スレッドの吸収はレイジーなタスクと主に
2つの点で異なっている。(1)スレッドの吸収は、ア
リケーションによって決定するスケジューリング・プロ
トコルが存在しても働く。レイジーなタスク生成はクロ
ーバルLIFOスケジュールと、インライフされたスレッドを保持するための単一の待ち行列の存在とを仮定す
る。(2)レイジーなタスク生成は、1つのプロセッサ
た対して1つのグローバル・ヒーブを用いる。レイジーなタスクの生成では、タスクがスティールされたとき、スレッド吸収の場合にはつかりつが、コレクションでは、システム内のすべてのスレッドを停止させる必要がある(コレクタそれ自身が並列であっても)。スレッドの吸収場合にはこの制約はない。

【0214】他の例はマスタ・スレーブのバラダイムであり、これは並列ブログラムを構成するためのボビュラ 一な技術である。この技術では、発生されたプロセスのコレクションは先験的に行われる。マスタ・プロセスはいくつかのワーカーブロセスを発生し、それらの結果を結合する、プロセスの通常は無型的には井布並行データ構造あるいは共有並行変数を通じて行われる。マスタ・スレーブ・プログラムがしばしば、ストック・マルブロセッサ・ブラットフォームとの結果の並列ブログラムより効率的である。それは、ワーカーが、それらの結果を発行する場合を除いて、ほとんど互いに適信する必要からいからである。それは、ワーカーが、それらの結果を発行いからである。それは、ワーカーが、それらの結果を発行いからである。それは、ワーカーが、それらの結果で表情である。それは、ワーカーが、それらの結果で表情である。それは、ワーカーが、それらの結果で表情である。それは、ワーカーが、それのヴラニュラリティを調整でき、より高い性能が得られる。

[0215] スキームにおけるファーストクラスのタブ ル空間を最盛化して実現するためにスティングを用い た。タブル空間は、同期化コンテント・アクセサブル・ メモリの抽象体として機能するオブジェクトである。タ ブル空間は、マスタイスレープにもとづく多数のアルゴ リズムを具体化するための自然の選択である。

【0216】タブルはオブジェクトであり、タブル・オ ベレーションはパインディング表現であって、ステート メントではないので、ファーストクラスの指示可能なタ ブル空間の存在により、モジュール性および表現性がさ らに向上する。望ましい実施例では、タブル空間は、同 期化したペクトル、待ち行列、ストリーム、セット、共 有変数、信号、あるいはパックとして特殊化できる。タ ブル空間上で許可されたオペレーションは、それらの表 示において不変である。さらに、アブリケーションは必 要ならタブル空間の間の極準端級を指定できる。

[0217] プロセスは新しいタブルをタブル空間に誘 み込んだり、除去したり、預けることができる。誘み込 みオペレーションあるいは除去オペレーションにおける タブル・引数は"テンプレート"と呼ばれ、"?"を前 に付けた変数を含むことができる。このような変数は "フォーマル"と呼ばれ、マッチ・オペレーションの結 果としてバインディング値を獲得する。これらのフォー マルによって獲得されたパインデイング値は、下位の表 現の評価において用いられる。従って、次のように書く ことができる。

[0218] (get TS[?x]

(put TS [ (+x1] ) )

これによって1つのタブルがTSから除去され、1だけインクリメントされ、そしてTSに再び預けられる。

【0219】この実施例ではまた、スレッド吸収も利用 して、タブル空間上で同期するグラニュラリティの細か い並列プログラムの構築を可能とする。スレッドはタブ ル内で真正な要素として用いられる。次の表現を実行す るプロセスPを考える。

【0220】 (rd TS [x1 x2] E) ここで、x1とx2は非フォーマルである。さらに、T S内のタブルがオペレーション (spaun TS

[E1 E2] )の結果として強けられているとする。 このオペレーションはE1とE2を計算する2つのスレッド(TE1およびTE2と呼ぶ)をスケジュールする。TE1とTE2が共に完了すると、結果としてのタブルは2つの確定したスレッドを含んでいる。マッチング・ブロシージャは、タブル内でスレッドに適遇したとき、threadーvalueを適用する。このオペレーションはそのスレッドの値を回収する。

【0221】しかし、Pが繋行されるときTE1がまた 大ケジュールされている場合には、Pはそれを自由に吸 収でき、その結果が×11に一数するときは譲渡する。一 数するものが存在しない場合には、Pは、スケジュール せれた状態にあるかもしれないTE2を残して、他のタ ブルのサーチへと進む。その後、他のプロセスがこのの じタブルを調べることは可能であり、正当な理由がある ならTE2を吸収する。同様に、TE1の結果が×1と 一数するなら、Pは次にTE2を自由に吸収できる。T E1またはTE2のいずれかがすでに呼酬を行っている 場合には、Pは、1つ(または両方)のストッドでブロ ックするか、またはTS内で、他に一致する可能性のあ るタブルを調べるかを選択する。タブル空間の意味規則 は、この点での実験例に対して割約を提りない。

[0222] スティングの、ファーストクラスのスレッドとスレッド吸収との組み合せは、共有データ構造を用いて、疑似要求によって懸動されるグラニュラリティの細かい (結果) 並列プログラムを書くことを可能とする、この後をて、スレッド・システムは、構造にもとづく同期化(例えば、タブル空間)とデータフロー・スタイルの同期化(例えば、フューチャー/タッチ)との間の意味のある区別の最小化を活みる。

【0223】スペキュラティブ並列は重要なプログラミング技術であるが、それを実現した際に生じるランタイムのオーバーヘッドのために、しばしば効果的に用いることができない。スペキュラティブ・プログラミング・

モデルをサポートするシステムに最も頻繁に係わる2つ の特徴は、他のものより一層有望なタスクを奨励する能 力と、不要な計算を中止および再利用(そして、恐らく 取消し)する手段を有することである。

【0224】スティングは次のことによって、ブログラマがスペキュラティブ・アプリケーションを書くことを可能とする.

【0225】1. ユーザがスレッドの優先順位を明示的 にプログラムすることを可能とする。

【0226】2.他のスレッドが完了したとき、あるスレッドがウェイトできるようにする。

【0227】3、スレッドが他のスレッドを終了させる ことを可能とする。

【0228】 健先順位をプログラムできるので、有望なタスクはそうでないものより先に実行することができる。タスクの組め中で最初に終すするタスクは、その終了の際、プロックされているスレッドをどれでも目覚めさせることができる。この機能によって、スティングは、そのタスクの組の中の他のタスクはすべて、それらの結果が千要であると確定されたなら、終了させることができる。しい、スティングを用いた理論の計算は、不要なタスクによってもたらされたノンローカルな副作用を取消すことはできないであろう。このシステムは基本的な遊長リのメカエズには提供しない。

[0229] waitーforーoneコンストラクト を実現することを考える。このオペレータは、並行して この引数のリストを評価し、その最初の引数によって生 成された値を復帰させ、終了する。従って、表現(wa itーforーone aja2... al...

 $a_n$ )において $a_1$ からvが生じた場合、この表現はv を復帰させ、そして、プログラマが必要とするなら、残 っているすべての $a_j$ 、j 
eq 1の評価を終了する。

【0230】AND並列を実現したwaitーforー allコンストラクトの仕様の同様である。これも並行 してその引数を評価する。ただしすべての引数を終った ときのみ真を復帰させる。従って表現(waitーforーall ala2・・・al・・・an)は、この 表現を実行するスレッドはすべてのalが終るまでブロ ックされているので、障壁即用化ポイントとして機能す る。このオペレーションの実現は、スペキュラティブw aitーforーoneオペレーションの実現と非常に 似ている。

【0231】TCはこれらのオペレーションを、共通プロシージャであるblockーのsetを用いて実現する。スレッドおよびTCBは、この機能をサポートするように定義されている。例えば、TCB構造体に関連しているのは、TCBの関連するスレッドが再開できる前に終了しなけらばならない、グループ内のスレッドの数に関する情報である。

【0232】block-on-setは、スレッドの
リストとカウントを取る。これらのスレッドは、上速し
たwait‐for-anーの・オペレーションあまびwa it‐forーaーlオペレーションの引数に対応して
いる。カウントの引数は、現在のスレッド(すなわち、
block-on-setを実行しているスレッド)が
再開を窓められる前に終了しなければならないスレッド
の数を表している。この数が「の場合、結果はwait‐for-oneを実現したものであり、上記数がnの場合、結果はwait‐for-allの実現である。
【0233】組の中のスレッド「g と、下を今べき現
在のスレッド(Tw)との関係は、下記のものに対する
参照を含むデータ構造(スレッド・バリア(TB)と呼
はれる)内で維持される。

[0234] 1. Tw OTCB

2. T<sub>g</sub> 上でブロックされている他のウエイターのTB (存在する場合) block-on-setを定義する ブログラムを、図12に示す。

[0235] 次のコール

(block-on-set m  $T_1 T_2 \dots T_n$ )

)

は現在のスレッド(「と言う)に、 $m個のT_1 \quad (m \le n)$  が終了したときアンプロックさせる。これら $T_1$  の それぞれは、それらのウエイターのチェーン内にTに対する参照を有している。

【0236】 アブリケーションはbkockーonーsetを、アプリケーションが終了したときa1によって起動されるプロシージャwakeupーwaitersと共に用いる。wakeupーwaitersは、そのスレッド引数内のウエイター・スロットから、連鎖状のウエイターの以入トを調べる。ウエイト数がゼロになるウエイターは、いずれかのVPのレディー待ち行列に挿入される。TCは、スレッドTが終了したときはいつも、wakeupーwaitersを起動する(例えば、Tが終了したとき、または異常に存在するときはいつも)。「の終了を待っているスレッドは、すべてこのようにしてリスケジュールされる

【0237】 これは2つのプロシージャが与えられる と、waitーforーoneは次のように簡単に定義 することができる。

[0238]

(define (wait-for-one . block-group)
 (block-on-group 1 block-group)
 (map thread-terminate block-group)

Tがwaitーforーoneを実行する場合、それは blockーgroup引数内のすべてのスレッド上で ブロックする。Tが再開されるとき、Tは、利用できる いずれかの仮想プロセッサのTPM内のレディー待ち行 列に配置される。Tの再開のとき実行されるマップ・プ ロシージャは、そのグルーフ内のすべてのスレッドを終 了させる。

【0239】スティングのプロシージャwaitーforーallは、このオペレーションを省略できる。それは、そのプロック・グループ内のすべてのスレッドは、そのプロック・ジループを行するスレッドが再開される前に、終了することが保証されているからである。

【0240】スティングは、8プロセッサのSilic on Graphics Power Series (MIPS R3000) と、16プロセッサのSilic on Graphics Challenge (MIPS R4400) の両方において実現した。両マシンは、共有(キャッシュ・コヒーレント)マルチプロセッサである。この抽象物理的マシン構成では、物理的プロセッサはライトウエイトのUnixスレッドにマッピングされる。マシン内の各プロセッサは、このようなスレッドの1フをテンさせる。

【0241】以上、コンピュータ・ソフトウエア・アーキテクチャの望ましい実施例について記述し、説明したが、当業者にとって明らかなように、本発明の広範な原

理および趣旨から逸脱することなく、種々の変形や変更 を加えることは可能である。

[0242]

【発明の効果】以上説明したように本発明によれば、高度並列マルチブロセッサ/マルチコンピュータ・システルを制御するための、現代のプログラミング言語に対する非常に効率の良いサブストレートとして役立つコンピュータのオペレーティング・システム・アーキテクチャを用いた高度並列コンピュータ・システムの制御方式が得られる。

【0243】更に本発明によれば、カスタマイズ可能な 仮想マシンにもとづく非同期の計算のためのソフトウエ ア・アーキテクチャを用いた高度並列コンピュータ・シ ステムの制御方式が得られる。

[0244] また本発明によれば、仮想プロセッサ上で ファーストクラスのオブジェクトとしてライトウエイト ・スレッドをサポートするソフトウエア・アーキテクチ ャを用いた高度並列コンピュータ・システムの制御方式 が得られる。

[0245] 更に本発明によれば、カスタマイズ可能な ボリシー・マネージャを、特にユーザ・レベルに含むソ フトウエア・アーキテクチャを用いた高度並列コンピュ ータ・システムの制御方式が得られる。

【0246】また、本発明によれば、カスタマイズ可能 な仮想トポロジーを含むソフトウエア・アーキテクチャ を用いた高度並列コンピュータ・システムの制御方式が 得られる。

[0247] 更に本発明によれば、スレッド吸収、遅延 TCB割り当て、ならびに記憶装置共有の場所としての スレッド・グループを含むソフトウエア・アーキテクチ ャを用いた高度並列コンピュータ・システムの制御方式 が得られる.

【0248】また本発明によれば、多様な形態のポート を含むソフトウエア・アーキテクチャを用いた高度並列 コンピュータ・システムの制御方式が得られる。

【0249】更に本発明によれば、上述のようなソフトウエア・アーキテクチャを用いて制御されるコンピュータ・システムが得られる。

### 【図面の簡単な説明】

【図1】本発明の一実施例によるソフトウエア・アーキ テクチャを用いた制御方式を示すブロック図である。 【図2】図1の抽象物理的マシンおよび仮想マシンを示

【図2】図1の抽象物理的マシンおよび仮想マシンを す図である。

【図3】本発明のオペレーティング・システムの抽象アーキテクチャを示す概略プロック図である。【図4】本発明で用いるスレッドの状態およびTCBの

状態の遷移を示す図である。 【図5】 木発明で用いる記憶基際の様成を素す網路図で

【図5】本発明で用いる記憶装置の構成を表す概略図である。

【図6】本発明で用いるスレッドのプログラミングを説明するためのプログラムを示す図である。

[図7] 本発明で用いる物理的プロセッサの2Dメッシュ上で多重化された仮想プロセッサの3Dメッシュを生成するプログラムを説明するための図である。

【図8】本発明で用いるコンテクスト・スイッチを始動 するプログラムを示す図である。

【図9】本発明で用いるコンテクスト・スイッチを終了 するプログラムを示す図である。

【図10】本発明で用いる新しいスイッチを開始するプログラムを示す図である。

【図11】本発明で用いるグラニュラリティの細かい適

## [図6]

応並列ソート・アルゴリズムのための最上位のプロシー ジャのプログラムを示す図である。

【図12】本発明で用いるblock-on-setを 定義するプログラムを示す図である。

## 【符号の説明】

- 10 抽象物理的マシン
- 11 物理的トポロジー
- 12 抽象物理的プロセッサ
- 13 仮想プロセッサ・コントローラ
- 14 仮想マシン
- 15 仮想プロセッサ・ポリシー・マネージャ
- 16 仮想プロセッサ
- 17 スレッド・コントローラ
- 18 スレッド
- 19 スレッド・ポリシー・マネージャ
- 20,20′仮想トポロジー
- 24 仮想マシン/アドレス空間 26 グローバル記憶プール
- 26 9H-70Vacie 7-1V
- 28 グローパル共有オブジェクト
- 30 ルート環境
- 33 ローカル・ヒーブ
- 35 グローバル・ヒープ
- 3 6 遅延
- 38 スケジュール
- 40 評価
- 42 吸収
- 44 確定
- 46 初期化 48 レディー
- 50 ラン
- 52 ブロック
- 5.4 保留
- 56 終了

## [図7]

```
(define ferent-disease) depth)
(dest (fine stilled (fine stilled (fine)))
(dest (fine stilled (fine stilled (fine)))
(dest (fine stilled (fine stilled (fine)))
(dest (fine (fine)))
(dest (fine)))
(dest (fine))))
(dest (fine))))
(dest (fine)))))
```

[図1]







[⊠5] (⊠8)

## 記憶装置の構成

# スシッド動的コンテクスト



評価中のスレッドオブジェクト

## [図10]

```
(def line (start-mer-thread)
(let (1c (correvieue "Thread has no value")))
(unmin'sprotect (set 2 (carch exit (set-the-dist) (carrent-the) exit)
(set (the correvieue "Thread has no value")))
(let (thread (corrent-thread))))
(thread-sprotect (carrent-thread)))))
(thread-sprotect)
(set (carrent-thread)
(set (carrent-thread))))
(set (carrent-thread)
(set (carrent-thread)))))
(set (carrent-thread)))))
```

```
(define (start-context-waitch natt-state)
(disclaim (start-context-waitch natt-state)
(disclaim (start-context-waitch natt-state)
(etc. (disclaim (start-context-waitch natt-state)
(start-natt-waitch (start-state)
(start-natt-waitch (start-state)
(start-natt-waitch (start-natt-waitch natt-state)
(start-natt-waitch (start-natt-waitch natt-state)
(start-natt-waitch (start-natt-waitch natt-state)
(start-natt-waitch natt-state natt-state)
(start-natt-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-start-
```

#### [図11]

```
(define Chick-or-set count threads)
(thread-sates-sourise (current-thread))
(thread-sates-sourise (current-thread))
(thread-sates-release (current-thread)))
(coult ("Caread" and)
(thread-sates-release (current-thread)))
(class ("Caread" and)
(caread" and "Caread" an
```